60分钟的文心一言发布会:我带你5分钟看完
theme: healer-readable
李彦宏缓缓走入会场。
亮了,他亮了。
文心一言具有五大功能: 1. 文学创作(写诗歌,写小说) 2. 商业文案创作(给公司起名,写宣传语) 3. 数理逻辑推算(做题) 4. 中文理解(理解华夏文化) 5. 多模态生成(文字、图片、音频、视频)
其中,前三个功能ChatGPT都有,我感觉百度搞不过它。
比如:
再比如:
但是,后两个功能是ChatGPT不具备的。
首先说中文理解。
老李说文心一言的重点是用中文训练。AI模型能深入中国文化到什么程度呢?
拿洛阳纸贵举例子,他连着问了模型几个问题。
尤其是第二个问题,洛阳纸贵,那么当时到底多少钱呢?
模型可以结合唐朝时期的物价以及相关文献记载,给出来答案:当时洛阳的纸由八百文涨到两三千文。
甚至让它以“洛阳纸贵”写一篇藏头诗,模型也写了出来。虽然比不上我写的,但是起码它藏头。
我们再来看看ChatGPT对于中文的理解是什么效果。
问ChatGPT洛阳纸贵什么意思,然后再问洛阳的纸多少钱。
很明显,它对第二个问题回答的不是很好。它没有清楚的理解我的问题,反而还指出了我的错误。它没有说具体多少钱,它说这不是贵的问题,只是一种现象。
而对于藏头诗,ChatGPT也是无能为力。
它可能知道什么是诗,但并不知道什么是藏头诗。因为,这就有点深入中国文化了。
但是,我相信,你让它解释藏头诗,它凭借搜索引擎是能找到并打印出来的。但是,你让它写,很遗憾。
ChatGPT没有的,文心一言有的,第二个功能就是多模态。
多模态是AI的一个专业名词,比如文本是一种模态,图片是一种模态。多模态就是多种形式。
我们知道,ChatGPT是一个文本单模态的语言模型。
我李哥演示了一个从文字到图片到语音再到视频的例子。
海报图片设计出来了。
然后再用四川方言讲出来。
最后生成视频。
其实,后面的几种模态并非是首发,只是一种整合。
语音合成是老技术了,这不用说。
图文转视频的功能,去年开始,在各大自媒体平台也纷纷上线了。包括头条号在内,写完一篇文章,可以自动生成视频。
但是,大多都是素材库的标签拼凑。生成的效果较差,有时候百度自己生成的,自己都无法通过审核。
但是,让ChatGPT干这些,它除了文本模态之外,它都会回复你它只是一个语言模型。
讲完了五大功能。后面说了三大产业机会。
中间休息,亮出了很多AIGC的案例。
休息完了,百度首席技术官,王海峰老师对文心一言的技术做了简单解读。
其实主要还是说了利用飞桨开源平台实现的。
然后介绍了文心一言模型的功能组成。
最后说,飞桨平台好!
结束前,官方平台宣布,企业用户可以申请内测。
方法在图片里面了,搜索关键词“百度智能云”填写表单就可以。
有个邀请体验说明是这样的:
我们期待与您尽快展开合作,但由于初期名额有限,目前暂不能满足所有人的申请,因此请您仔细填写需求,我们会结合业务场景、访问量等级等信息综合评估,并在您通过评估后尽快给您反馈,本次邀测仅面向企业用户,谢谢您的理解。
最后,我感觉李哥和王老师在讲的时候,声音有些发颤。可能理工男面对大型发布会都有怯场的情况,也可能他们对平台不自信。
整个发布会,都是在播放视频,并没有现场实际操作平台。这也是为了达到最好的发布效果。李哥说,实际操作的话会比较慢,大家需要等。
我感觉,抛去技术不谈,文心一言在中国肯定是有市场的。
因为,我在直播间发布了很多信息,都没有显示。但是,当我和大家万众一心时,我的评论赫然出现在字幕上。
这一点,ChatGPT无论如何是无法做到的!
我们不黑不吹,后续的情况,只能等待用户的反馈了。
- 60分钟的文心一言发布会:我带你5分钟看完
- 程序员写小说:我甘心当韭菜
- docx格式文档详解:xml解析并用html还原
- 评论二则:年龄大了能否写代码、上大学不喜欢IT专业咋整
- ChatGPT火了,我连夜详解AIGC原理,并实战生成动漫头像
- 咱不吃亏,也不能过度自卫
- 兔年了,利用AI风格化实现剪纸兔、年画兔、烟花兔
- 傻吗?谈男人们饭桌的拼酒现象
- 他扔出一张对话截图:王总说的
- 老张说:快过年了,搞个AI作曲,用TensorFlow训练midi文件
- 为什么大家都看中学历?
- 年底了,裁兄弟当职员那哥们儿,如今咋样了?
- 老张让我用TensorFlow识别语音命令:前进、停止、左转、右转
- 在掘金第一次记录失眠
- 十五分钟简介人工智能,以听懂为目的
- 认知史 12:积累阶段,没资格攀比
- 认知史 16:人过留名,雁过留声
- 认知史 4:普遍共识
- 一文讲通OCR文字识别原理与技术全流程(科普版)
- 认知史 7:选择和努力