GPT3 和 CPT4 的差异有多大?

bluesky1年前 ⋅ 1082 阅读

目前大火的ChatGPT用的是GPT3.5,GPT 3 有1750 亿参数,而接下来的GPT4 的参数高达100 万亿。

一般情况下,大脑约有 800-1000 亿个神经元(GPT-3 的数量级)和大约 105 万亿个突触。GPT-4 将拥有与大脑的突触一样多的参数,虽然还有很多卡点,但这很惊人...

参考资料:

  1. 谷歌
  2. https://mp.weixin.qq.com/s/90JeHnRyKjx-CxlDPDuM1A

6月27日,百度在其官网上发布的一篇文章显示,根据《中国科学报》的报道(Ernic Bot)3.5版本在若干关键领域,已经超过了现在的ChatGPT,甚至击败了OpenAI最新、更先进的模型GPT—4.

百度首席技术官王海峰博士说,与文心大模型3.0版本相比,3.5版本在效果、功能、性能上全面提升、这不仅表现在文心大模型的创作、问答、推理和代码的提升上。

以下是《中国科学报》发布的“文心一言”3.5和其他大模型评测结果对比。


大模型AGIEvalAGIEvalAGIEvalC-EVAL-valMMLU
总集中文英文中文英文
ERNIE3.557.1164.3750.5971.9365.10
ChatGPT44.7340.2748.7551.768.85
GPT-461.4856.9665.5568.5782.47
ChatGLM-6823.6425.9421.0836.1838.88
LLaMa-7B21.4821.1721.8326.4933.86
LLaMa-13B47.03
LLaMa-65B30.1829.8430.5542.3763.94

评测时间2023-06-13图片来源:中华科学报

上图左边一列,是参与评测的各种大模型,其中包括“文心一言”3.5、ChatGPT、以及其升级迭代版本4.0等。而横坐标则是各种测试场景(测试集),“AGIEval”是指微软发布的一项标准化测试集,包含了20种中美两国的考试。

在英文和整体情况下,“文心一言”3.5也已超过ChatGPT,仅仅落后于GPT﹣4,中文当然更不在话下了:表中的“C—Eval”评测基准就是一套中文基础模型评测集,包含13948个多项选择题、涵盖52个不同的学科,“文心一言”3.5将ChatGPT和GPT—4斩落马下。

(改编自《文心一言,终于超越ChatGPT?》)


https://codenews.cc/view/276844   这里  
@Seewo  

全部评论: 0

    相关推荐