百度发布文心一言时间(百度发布文心一言4.0)
原标题:百度发布《文心一言》,李彦宏回应为何现在发布:市场需求旺盛
·李彦宏表示,大家的期望是对标ChatGPT,甚至GPT-4。这个门槛还是很高的。在全球各大厂商中,百度是第一个“发布”的。他表示,《文心一言》内测并不完善,之所以现在发布,是因为市场有旺盛的需求。
“从文心一言的表现来看,它在一定程度上具备了理解人类意图的能力,其回答的准确性、逻辑性、流畅性正在逐渐接近人类水平。但总体而言,这类大型语言模型还远远没有达到人类的水平。”完全发育”。
3月16日,百度正式发布大型语言模型及生成式AI产品“文心一言”。百度创始人、董事长兼首席执行官李彦宏、首席技术官王海峰出席发布会。李彦宏在文学创作、商业文案创作、数学计算、中文理解、多模态生成五个使用场景中展示了文心一言的综合能力。
“生成式人工智能代表了一种新的技术范式,是任何公司都不应错过的巨大机遇。”李彦宏表示,“这段时间一直有人问我,为什么现在才发布?你真的准备好了吗?事实上,百度文心在过去十年里一直在持续投入人工智能研发。第一“文心一言的版本于2019年发布,此后每年都会发布新版本。从这个意义上说,文心一言的推出只是我们多年来努力的自然延续。”
李彦宏表示,大家的期望是对标ChatGPT,甚至是GPT-4。这个门槛还是很高的。在全球各大厂商中,百度是第一个“发布”的。他表示,《文心一言》内测并不完善,之所以现在发布,是因为市场有旺盛的需求。它的定位是通用大型车型。
李彦宏认为,多模态是生成式人工智能明显的发展趋势。未来,随着百度多模态统一大模型能力的增强,闻心一言的多模态生成能力也将不断提升。大模型将带来三大产业机会:新型云计算、产业模型微调、应用开发。
发布会召开时,截至14点22分,百度集团(09888.HK)股价下跌近10%至120.5港元/股。
演示五个场景下的能力
发布会上,百度播放了“文心艺言”的演示视频。以下为实际演示录音。
创意写作
问题:
·《三体》的作者来自哪里?
·你能总结一下《三体》的核心内容吗?如果你想继续写,可以从哪些角度开始?
·如何从哲学角度继续写作?
·电视剧《三体》的演员有哪些?
·于和伟和张鲁一有什么共同点?
·于和伟和张鲁一谁更高?
李彦宏:刚才的演示中,“总结三体核心内容”体现了文心一言的总结分析能力。继续写《三体》,体现内容创作和生成的能力。
《三体》的作者是谁?他从哪里来的?电视剧《三体》的演员有哪些?温心一言的回答是正确的。如您所知,生成式人工智能等产品在回答事实问题时有时会出错。文心一言延续了百度的知识增强大模型理念,大大提高了事实题的准确率。
于和伟和张鲁一有什么共同点?于和伟和张鲁一谁更高?这类问题的背后,体现的是温心一言的推理能力。例如,它需要知道两个人的确切身高才能得到正确的答案。
商业文案
问题:
·如果你想成立一家用大模式服务中小企业数字化升级的科技服务公司,你可以选择什么公司名称?
·数智云图名字起得好。给我一个公司服务口号,表达双赢的理念。
·帮我制作一份关于公司成立的新闻稿。数智云以大模式,以共赢的服务理念服务中小企业数字化升级。字数为600字。
李彦宏:刚才的演示展示了文心一言的连续三场内容创作。
AI要想写好稿子,不仅需要准确理解我们的意图,还需要具备清晰表达意图的能力。
这背后有一个基础,那就是庞大的数据规模。人类常说“读万卷书”,而AI则可以说“读万卷书”。文心一言大模型的训练数据包括万亿级网页数据、数十亿搜索数据和图像数据、数百亿日常语音通话数据以及5500亿事实的知识图谱等,这使得百度能够在在处理中文方面具有独特的地位。
研究表明,如果数据规模足够大,参数达到千亿级,大型模型中可能会出现“智能涌现”,即使在没有经过专门训练的领域也能出现知识理解和逻辑推理能力。
数理逻辑计算任务
问题:
·我们来玩鸡和兔同笼游戏吧。鸡有2条腿和1个头,兔子有4条腿和1个头。那么,如果一个笼子里有9个头、40只脚,那么应该有多少只鸡和兔子呢?
·我们来玩鸡和兔同笼游戏吧。鸡有2条腿和1个头,兔子有4条腿和1个头。那么,如果一个笼子里有9个头,30个脚,那么应该有多少只鸡和兔子呢?
李彦宏:关于第一个问题,温心一言计算了一下,认为这个问题可能有错误。对于第二个问题,文心一言不仅给出了正确的结果,还给出了解决问题的详细步骤。可以看出,文心一言能够理解题意,有正确的解题思路,然后像学生做题一样,按照正确的步骤一步步算出正确答案。
温心一言已经具备了一定的思维能力,可以学习数学推演、逻辑推理等相对复杂的任务。当然,现阶段准确率还不是100%,我们需要给它更多的时间来学习和成长。
中文理解能力
问题:
·“洛阳纸贵”是什么意思?
·当时洛阳的纸张有多贵?
·这个习语在现行经济原理中对应的理论是什么?
·用“洛阳志贵”四个字写一首藏头诗。
李彦宏:“洛阳纸贵”和“藏头诗”,考验AI对中文和中国文化的理解。
作为植根于中国市场的大型语言模型,文心一言拥有中文领域最先进的自然语言处理能力。这个例子清楚地展示了我们中文的优势。
相应地,一言目前在英语语言和编码场景方面的训练还不够,表现也不够好。下一步,我们将加大培训力度,不断提高这些能力。
多模式生成
问题:
·请为2023年世界智能交通大会制作海报。
·您认为智慧交通最适合哪个城市发展?
·请用四川话说出以上内容。
·请生成上述内容的视频。
李彦宏:刚才的演示中,温心一言生成了文字、图片、音频和视频,展示了多模态生成能力。目前版本已经可以生成文字、图片和语音。由于生成视频的成本比较高,目前还没有向所有用户开放。未来我们会逐步接入。不过熟悉百家号创作的朋友应该都体验过这个功能。每天都有数以万计的文章被转换成视频内容并通过该能力在百度上分发。
多模态是生成人工智能的明显发展趋势。未来,随着百度多模态统一大模型能力的增强,闻心一言的多模态生成能力也将不断提升。
“四层架构的每一层都有领先产品”
演示结束后,李彦宏总结道:“从文心一言的表现来看,它在一定程度上具备了理解人类意图的能力,而且其回答的准确性、逻辑性、流畅性正在逐渐接近人类水平。但总体而言,这种大型语言模型还远未得到充分开发。它们有时表现得惊人的好,但在很多场景下,仔细观察就会发现明显的bug,还有很大的改进空间。未来,这肯定会随着时间的推移而迅速发展,日新月异。”
李彦宏表示,通过有针对性的微调,我们可以逐渐对百度内外的各种产品展现出惊人的亲和力,让每个产品更贴近它的用户和客户。像文心一言这样的大型语言模型将成为每个人不可或缺的生产力工具。然而,无论是哪家公司,都不可能在几个月内建立起如此庞大的语言模型。深度学习和自然语言处理需要多年的坚持和积累,不可能一蹴而就。
“人类已经进入人工智能时代,IT技术的技术栈发生了根本性的变化。以前基本分为三层:芯片层、操作系统层、应用层。现在可以分为四层:芯片层、框架层、模型层、应用层。”他表示,“如今,百度是全球为数不多的在这四层拥有全栈布局的人工智能公司之一,从高端芯片昆仑核心,到飞飘深度学习框架,到文心预测,从训练大型从模型到搜索、智能云、自动驾驶、小度等应用,我们在各个层面都拥有业界领先的自研技术。”
文心一言位于模型层。2019年,百度推出文心大模型ERNIE1.0。目前,ERNIE3.0每天接受数十亿次用户搜索请求。这使得闻心一言能够基于庞大高效的数据池快速学习和提高。
“大模型训练堪称暴力美学,需要大算力、大数据、大模型,每个训练任务的成本都很高。全栈布局的好处是可以在四层中实现端到端”技术栈层架构,优化大大提升了效率,特别是框架层和模型层有很强的协同作用,可以帮助构建更高效的模型,显着降低成本。-大规模模型给深度学习框架带来了巨大的挑战,比如为了支持千亿参数模型的高效分布式训练,百度飞桨专门开发了4D混合并行技术。李彦宏介绍。
“此外,芯片、框架、大模型、终端应用场景可以形成高效的反馈闭环,帮助大模型不断调优迭代,让其变得越来越好。更好的大模型将不断升级用户体验。”
最后,李彦宏强调:“全球范围内,几乎没有一家公司在四层架构的每一层都拥有领先的产品。百度的优势非常独特,相信大家在文信后续的迭代速度中会有清晰的感受。”返回搜狐查看更多