【财新网】“大模型具有强大的理解、分析和推理能力,下一步在包括金融在内的很多行业中都会产生非常大的作用。”科大讯飞总裁吴晓如坦言。
在11月27日举行的第三届济南科技金融论坛上,吴晓如以过去三年用各家大模型做高考数学题的成绩从60分迅速提高到140分的例子开场,表明大模型的迭代与进步之快。他表示,人工智能背后的三大驱动力,算力、算法、数据,都在快速发展,形成“三轮驱动”。 科大讯飞一开始就在自主算力的基础上训练了自己的大模型,和华为一起解决了算法、框架、算子等一系列的很多问题,将单卡效率从原先的30%提升至了95%。目前在自主可控的体系下,一些全新算法已经可以实现,如混合专家模型(MoE)、深度思考、慢思考等架构。此外,目前已经可以将‘满血版’部署在标准服务器上,即实现在单一服务器上全尺寸模型的应用。”实现这一点并不容易。吴晓如解释道,将“满血版”Deepseek部署在单一服务器上可能就比较困难。



















京公网安备 11010502034662号 