编程模型哪家强?

bluesky7月前 ⋅ 1177 阅读

RT.

自然是gpt4!这货霸榜这么久其实力之恐怖!

之前有个 Code-Llama-34b 也很强,但是经过不止下面这道题的对比后发现 DeepSeek-Coder 更甚前者,尤其是对编码和中文提问的理解上更加深入。应该是训练数据中包含了大量的中文和英文代码,才能同时在这两方面表现出如此优秀的效果。

经过不同问题的手动问答和连续问答测试,发现 Code-Llama-34b 大概率是严重缺少中文数据,第2轮回答直接全英文了。。


参考链接:

  1. https://deepseekcoder.github.io/
  2. https://github.com/deepseek-ai/DeepSeek-Coder
  3. https://medium.com/@tanalpha-aditya/deepseek-coder-when-the-llm-meets-programming-better-than-gpt-3-5-054cf85e3493

全部评论: 0

    相关推荐