百度集团副总裁吴甜:文心大模型 3.5 能力已经超出 ChatGPT 3.5

全景资讯社 次浏览    来源:全景资讯社

网文内容

7 月 19 日消息,“新版本文心一言的能力已经超出 ChatGPT 3.5,这也是在我们国内开展相关技术工作重要的里程碑。”百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜向网易科技等媒体表示。

百度集团副总裁吴甜:文心大模型 3.5 能力已经超出 ChatGPT 3.5

她介绍,IDC 最新发布的《AI 大模型技术能力评估报告,2023》显示,百度文心大模型 3.5 拿下 12 项指标的 7 个满分,综合评分第一,算法模型第一,行业覆盖第一。

据悉,IDC 评估报告围绕产品技术、服务生态以及行业应用三大维度,考察大模型的 10 余项指标,国内主流大模型包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等 14 家厂商参与了本次评估。报告结果显示,百度文心在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。

吴甜介绍,百度自 2019 年开始深耕预训练模型研发,先后发布知识增强文心系列模型。前不久,百度正式发布文心大模型 3.5 版本,进一步在基础模型、知识增强、检索增强等多项核心技术上取得创新,新版本在各项能力上均有明显提升。

具体而言,她表示文心大模型取得“第一”得益于百度“芯片-框架-模型-应用”四层技术栈优势、知识增强的核心特色和繁荣的大模型生态三大优势。尤其是百度拥有自研的深度学习平台飞桨有力支撑了大模型的高效训练和推理。飞桨与文心的协同优化,让文心大模型 3.5 最新版本的模型效果提升 50%,训练速度提升 2 倍,推理速度提升 30 倍。

百度集团副总裁吴甜:文心大模型 3.5 能力已经超出 ChatGPT 3.5

在大模型生态方面,她介绍,百度文心已形成企业、教育、社区三位一体的生态体系。最新数据显示,百度有超过 750 万开发者基础,20 万企业生态基础,多层次开展大模型人才培训、企业赋能、开发者运营。百度还设立了 10 亿创投基金鼓励大模型创意、繁荣大模型生态。

她直言,目前大模型产业化仍面临着巨大的挑战,总结起来有三方面:首先是大模型的体积确实很大,带来的训练难度高、成本高;第二是对算力规模要求非常大,性能要求非常高;第三在于数据规模也很大,收集、挖掘、建设、筛选、清洗这些数据,本身也是非常大的大工程。“大模型平台是价格昂贵的大算力系统,其实完全不需要存在大量的大模型,对于应用者来说也不需要每个应用都进行大模型的开发。”

至于“百模大战”的终局是怎样的?吴甜谈到,“过去短短几个月时间,大量新的大模型出现,但这是个阶段现象,未来各个企业和机构会逐渐找到自己的定位,下一步会走向自己细分的方向,终局只会集中在少量的几个大模型,但依托几个少量大模型,会有非常广泛的应用生态出现。”

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

随机内容
东风汽车宣布将与一汽、长安共同打造车用操作系统 东风汽车宣布将与一汽、长安共同打造车用操作系统
【IT之家众测】12.7 寸高刷大屏平板,卷到千元了!联想小新 Pad Pro 12.7 骁龙版体 【IT之家众测】12.7 寸高刷大屏平板,卷到千元了!联想小新 Pad Pro 12.7 骁龙版体
宝马 CEO:由于欧盟内燃机禁令,欧洲车企无法赢得与中国对手的价格战 宝马 CEO:由于欧盟内燃机禁令,欧洲车企无法赢得与中国对手的价格战
微星将推 RTX 4060 NV 限量版显卡,绿色外观 微星将推 RTX 4060 NV 限量版显卡,绿色外观
广汽丰田回应新凯美瑞刹车点头缓解系统收费:测试内容,无需付费 广汽丰田回应新凯美瑞刹车点头缓解系统收费:测试内容,无需付费
微软 Win11 内置“照片”应用将迎来一键抠图、替换背景等新功能 微软 Win11 内置“照片”应用将迎来一键抠图、替换背景等新功能
《博德之门 3》拿下金摇杆 7 个奖项后,拉瑞安创始人希望更多 CRPG 作品出现 《博德之门 3》拿下金摇杆 7 个奖项后,拉瑞安创始人希望更多 CRPG 作品出现
Rust 团队前成员 Jonas Schievink:对领导委员会感到失望,自愿退出并移除项目署名 Rust 团队前成员 Jonas Schievink:对领导委员会感到失望,自愿退出并移除项目署名
杭州亚运会“亚运元宇宙”正式发布:融合 AI、VR、数字孪生,可提供“沉浸式 杭州亚运会“亚运元宇宙”正式发布:融合 AI、VR、数字孪生,可提供“沉浸式
NASA 测试下一代火星直升机,为样本返回任务做准备 NASA 测试下一代火星直升机,为样本返回任务做准备