谷歌Bard大幅优化AI语言模型，数学计算能力提升30%，新增表格导入功能

Bard 是谷歌公司为了对抗 ChatGPT 和 BingChat，在今年 3 月 21 日正式推出的一款聊天机器人。此次更新是谷歌继 5 月新增 Bard 图片回复功能后的又一次功能迭代，主要针对 Bard 的数学计算能力，预计能将 Bard 解决数学问题的能力提高 30%。

一、结果的生成：不只靠预测，加入计算力

Bard 这次的具体更新内容包括两个方面：

1、提升在数学计算、编码问题和字符串操作方面的能力；

2、提供了一个 " 到谷歌表格 " 的新导出选项。有了这个新功能，用户可以将 Bard 在其回答中创建的表格直接导出到表格中。

在第一项更新中，Bard 使用了一种名为" 隐式代码执行（implicit code execution）"的新技术，它可以让 Bard 编写和执行自己的代码。最新版本的 Bard 识别能根据逻辑代码的提示，在后台编写代码、对其进行测试，并使用结果来生成更准确的回答。

这大大提高了 Bard 的推理和数学能力，使其有能力解决高级推理和逻辑性较强的复杂问题。如：

15683615 的质因数是什么？

计算某人储蓄的增长率

倒写单词 "Lollipop"

▲ Bard 对倒写单词 "Lollipop" 的回复

Bard 之前所使用的 LLM（大语言模型）像是一个预测引擎。LLM 根据提示，来预测可能进一步出现的词汇，进而生产回复，整个流程并不涉及精细的逻辑推理与计算。因此，他们有能力解决语言类、创造性任务，但却无法准确回答推理、数学等领域的问题。

二、结合大模型与传统代码，准确度提高 30%

这项技术的灵感来源是二分法，特别是丹尼尔 · 卡尼曼（Daniel Kahneman）的双系统思维模型，他认为人的大脑存在两个系统，并称之为系统 1 和系统 2：

系统 1 是无意识思考，是快速的、直观的、毫不费力的，如一个乐手在演出现场即兴演奏，使用的就是系统 1 思维；

系统 2 则需要耗费精力、保持专注，是缓慢的、审慎的，如人们运用数学运算、学习专业乐器演奏时，使用的是系统 2 思维。

以此类比：

LLM 是在系统 1 思维下运作的——没有经过深度思考，快速产生文本；

传统代码计算方法则与系统 2 类似——公式化、不灵活，但能产生正确的结果。

以做一道数学题为例，如果只使用系统 1，那根本不需要解题方法，直接把想到的答案写出来就行了；但是加上系统 2 后，便可以运用加减乘除等数学方法去解题。

本次更新中，谷歌结合了 LLM（系统 1）和传统代码（系统 2）的能力，来帮助提高 Bard 反应的准确性。谷歌称，在他们的内测数据集中，Bard 解决计算类问题的准确性提高了约 30%。

即使这样，Bard 也无法保证回应的绝对准确。Bard 不会生成有助于提示响应的代码，它生成的代码可能是错误的，它也无法保证一定将执行的代码包括在其响应中。

结语：各大厂商关注机器人逻辑性，AIGC 准确性将继续提高

6 月 1 日，OpenAI 宣布 ChatGPT 数学解题能力将大幅提升，现在，谷歌也宣布了 Bard 的数学计算能力提高了 30%。

这向我们释放了强烈的讯号，即 AIGC 聊天机器人行业陆续在关注着 AIGC 解决复杂问题的能力、生成内容的准确性，并不断在以各种方式提升 AIGC 内容的结构化、逻辑性。未来，我们将享受到能力更强大、结果更准确的 AI 服务。