百度的文心一言 没有想象中那么差

语言: CN / TW / HK

robin 的演示

我们用 robin 的演示例子来对比一下 文心一言和 ChatGPT 的真实表现(毕竟发布会上是录的)。 注意,我使用的 GPT 版本是 4.0

文学创作

1 三体的作者是哪里人?

文心一言:

ChatGPT:

嗯,中文表现上文心一言更好。

2 电视剧三体的演员都有谁?

文心一言:

ChatGPT:

关于这个问题 ,由于 ChatGPT 的数据只能查到 2021 年的,所以它不知道是正常的。

3 主演 于和伟 和 张鲁一 谁更高?

文心一言:

ChatGPT:

4 可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发?

文心一言:

ChatGPT:

虽然网络出一点儿问题,但我更喜欢 ChatGPT 的回答。

商业文案创作

1 如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起个什么公司名?

文心一言:

ChatGPT:

显然我更喜欢文心一言的,但如果你跟 ChatGP 继续聊下去,它可能提供更进一步符合你需求的答案。

2 数智云图这个名称不错,给我起一个公司的服务 Slogan,表达共赢的概念

文心一言:

ChatGPT:

这一轮文心一言的回答更好。

3 帮我生成一篇公司成立的新闻稿,数智云图以共赢的服务理念用大模型服务中小企业数字化升级。字数 600 字

文心一言:

ChatGPT:

ChatGPT 试了几次网络都有问题,这一轮不好评价。

数理逻辑推算任务

1 鸡兔同笼问题

文心一言:

ChatGPT:

这一轮没有意外,我更喜欢 ChatGPT 的回答。

中文理解能力

1 “洛阳纸贵”是什么意思?

文心一言:

ChatGPT:

感觉差不多。

2 当时洛阳的纸到底有多贵?

文心一言:

ChatGPT:

那么这一题,ChatGPT 开始一本正经的胡说八道了。

3 这个成语在现在的经济学原理里,对应的理论是什么?

文心一言:

ChatGPT:

4 用洛阳纸贵四个字写一首藏头诗。

文心一言:

ChatGPT:

ChatGPT 给出的结果明显不对。

多模态生成

目前文心一言的测试版本并不能生成语音和视频,但是可以直接生成图片,图片的质量比想象中的要好,而且还有很多的风格可以选择,比如说卡通风格,油画风格,还有很多的风格,可以满足不同的需求。

绘画能力应该是集成了现成的文心一格。

以下是我试的几个例子

描述: 请为 2023 世界智能交通大会创作一张海报。

描述:“灌木丛中的一朵机械花,有金属花瓣,周围环境和人的镜面反射,鸟瞰图。 构图夸张,具有强烈的视觉冲击力和叙事性”

描述:“雨天香港、哥特式建筑 3D 画风”

描述:“一只睡在柜子上面的猫,卡通风格”

描述:“麦田中的少年,油画风”

坦率讲与 midjourney 的绘画能力相比,文心一格的绘画能力还是有差距的。

编程

1 请帮我写一个网页版的贪吃蛇游戏

文心一言:

ChatGPT:

虽然又遇到了网络问题,但各位开发老铁们,不用我说了吧,都知道该选啥哈

2 生成测试数据

文心一言:

ChatGPT:

ChatGPT 完胜

文心一言使用注意事项

在使用过程中出现了排队的情况:

这我在使用 ChatGPT 的时候可没有遇到过。

可以输入“/” 来获取模版

绘画的例子上文举过了,我们来看看剩下 2 个:

查一个知识

写一篇报告

总结

经过试用文心一言,再对比 ChatGPT,我认为:文心在中文语料上应该是更丰富些。多语言上目前一定不如 ChatGPT 优秀。虽然这两个模型在某些方面有所重叠,但它们在应对特定语言和领域问题时具有各自的优势。

其实最令我意外的是,文心一言并没有发布会时让人感觉的那么差。它不是 chatPPT, 至少目前看不是,它完成了从 0 到 1 的过程 ,虽然有差距,但还是真心地希望国内的企业能够在 AI 的领域做出一些成绩,而不是一味地跟风。

我现在理解了 😊