会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 腾讯大模子的绝活,居然是宣告会上没吹的写代码?!

腾讯大模子的绝活,居然是宣告会上没吹的写代码?

时间:2024-11-06 22:25:25 来源:Angela III.网 作者:时尚 阅读:923次

原问题  :腾讯大模子的腾讯绝活 ,居然是大模的绝宣告会上没吹的写代码?

就在明天腾讯的全天下数字生态大会上 ,腾讯大模子混元终于亮相了 。活居

为甚么要说终于?

在各方新闻看来 ,然宣除了像小米这种说不规画做大模子的上没之外,绝大部份大厂们根基都已经陆续上线过大模子了 。写代

着实 ,腾讯腾讯自己也在 6 月中旬就推出了自己面向 B 端行业的大模的绝 MaaS ( Model-as-a-service ,模子即效率 )处置妄想。活居

妄想中搜罗了良多行业大模子 ,然宣只不外当时腾讯的上没通用大模子仍是还很怪异。

后续的写代种种新闻、报道里 ,腾讯腾讯也在外部不断打磨混元大模子。大模的绝

以是活居这也让差评君对于混元的期待值 ,越来越高  。

事实上一个用 “hun yuan ” 名号的 ,可是打了一整套闪电五连鞭。

话未多少说 ,下面就开始新一轮大模子测试。

本次测试以及混元同场竞技的是,大模子界的老学长 ChatGPT。

全部测试关键将分:老例语义清晰 、重大下场清晰、不断对于话与脚色饰演能耐 、学习能耐 、代码能耐、数学能耐 、长文总结,以及巨匠喜闻乐见的弱智吧问答等 8 个维度。

这次咱们一失常态,把长文总结能耐的测评放在了第一位。

由于咱们让大模子总结的 ,便是这篇测评自己( 除了长文总结能耐部份 )。

至于能不能当成省流版 ,往下看你就懂了。

混元的总结颇为精练,但过于精练 ,致使于我很难从这个总结患上出实用的信息。

但当我让他睁开讲讲的时候着实还行,但迷惑惹是生非了 “ 长文总结 ” 这个模块  。

而 ChatGPT 由于输入字数限度 ,被我酬谢分成了两部份输入 ,不断定这有无没影响它的总结能耐 。

在回覆中 ,它莫名抽剥了对于自己的所有评测 ,致使没在总结里写出混元的数学能耐、弱智吧问允许战以及差评君的意见 ,也欠好用  。

看来,这俩大模子总结患上都没那末欠缺,想看看两家事实甚么水平 ,巨匠还患上子细往下看诠释。

首先咱们做的测试是老例的语义清晰下场 。

下场是清晰 “ 原本谁都看不上  ,如今谁都看不上 ” 。

这句话混元清晰患上挺好 ,根基讲明了我对于独身这事的调侃,两个 “ 看不上 ” 都批注上了。

但 ChatGPT 说的仍是很 ChatGPT ,说至多的话,犯最蠢的错 。

他原本声名患上至关到位 ,特意是合成这句话是用幽默的方式来调侃独身,还带着一丝无奈神色  ,很低级 。

但它残缺没品出这先后两个 “ 看不上 ” 里 ,带有反转的幽默感 ,遗憾 。

接下来咱们看混元的重大下场清晰能耐 。

下场是魂穿到官渡之战中袁绍身上 ,光阴节点是骂完许攸之后  。

既要回覆奈何样破局赢下官渡之战,还要提供进一步不同天下的妄想。

要给巨匠稍微讲下这题为啥是重大提问。

由于要回覆这题 ,首先患上熟习三国这些人物历史布景、相关故事,特意是骂完许攸这个光阴节点很怪异。

由于在这之后许攸投靠曹操,献计火烧袁绍囤积在乌巢的粮草 。

最终以少胜多击败袁绍,随后多少年内残缺吞下冀北逐渐不同南方 。

而进一步想象里的不同天下 ,更是曹操自己都没能实现。

以是大模子们要欠缺清晰并回覆这个下场,那网文作者们根基可能宣告失业了。

AI 浪潮下的网文作者现状

经由测试 ,两个大模子的回覆都很艰深。

从一起头,两者都没能清晰自己穿梭饰演袁绍脚色的指令。

混元急哄哄地给袁绍出主张  , ChatGPT 则因此为我要穿梭 ,教我处事。

至于两个给的回覆 ,既不 get 到我提出这个怪异光阴节点的妄想,也不甚么卓实用果的策略妄想 ,都是些艰深而谈的车轱辘话 。

相对于而言,总体感应ChatGPT 的稍胜一筹。

事实 混元 可是愿望袁绍去以及曹操建树互利双赢的关连,哈哈哈 。

既然一个重大指令两个魔难都清晰欠好,那爽性重大点 ,让两者去脚色饰演一个婚礼主持人  ,一点点诱惑妨碍不断对于话 。

服从立马就能发现混元以及 ChatGPT ,就像文科生以及文科生的差距。

混元的回回重大不啰嗦,但有的时候过于生硬 。

你说有错吧,谈不上 ,你要说给高分确定不可能。

而 ChatGPT 就黑白论对于不同过错 ,先把字写满再说。

看概况的形貌啥的都很好,但着实从中间就已经清晰错意思  ,搞混了我的妄想 。

以是两者都不欠缺 ,都有待改善 。

而后咱们还重点魔难了下大模子的翰墨学习能耐。

搬出了昔时的火星文 ,给两个考生上上强度 。

先是丢了一篇火星文版的朱自清《 背影 》名时事给大模子学习 。

而后让他们分说用这种气焰写一篇养金毛心患上 。

服从便是 ,混元不愧是外乡大模子 ,背靠火星文开山祖师滥觞地 QQ 空间便是有优势,火星文的熟练度至关不错  。

第一眼就悟到了火星文的精髓,颇为顺遂地学习了火星文的创作本领 。

而 ChatGPT 尽管意见到火星文是一种不尺度的中文方式,但他着实学不会这种方式,最后致使直接招供自己不可了 。

接下来就到了代码能耐的审核 。

这次出的问题是,写一个今世极虚心焰的 925 行动抽奖页面,页面中必需有精明的 925 标志 。

提及来,由于混元宣告时对于代码能耐根基没咋提 ,以是原本咱们对于混元的代码能耐没啥期待。

但论这个问题 ,混元的下场至关不错 ,玄色配色的极客风有了,页面逻辑也没啥下场 。

致使还预留了给咱们交流 logo 的位置知足咱们有 925 精明的志的地域 ,至关成熟 。

比力之下 , ChatGPT 致使把极客风清晰成为了 925 极客行动 。。 。全部抽奖界面也颇为毛胚 。

混元页面下场

ChatGPT页面下场

除了代码下场,数学便是另一个大模子的老浩劫了。

这次咱们也挑了不少数学下场给两个考生做  ,从小学 1 年级不断做到了月朔 。

最终混元大模子在六年级时挑战失败,到了月朔同头横三竖四,也让咱们残缺坚持测试了 。

而 ChatGPT 清晰还缺少力。

5年级测试题

6年级测试题

月朔测试题

尽管 ,最后也少不了网友们喜闻乐见的 “ 弱智吧 ” 精选套餐 。

这次咱们更新了题库,用上了往年上半年最新的弱智吧精选下场 ,咱们发现可能 AI 最后的图灵测试可能还真是弱智吧 。

由于在大部份测试里,混元以及 GPT 根基都不够弱智而无奈精确清晰下场 ,这点上,人类遥遥争先 !

除了以上这些老例测试外 ,混元宣告会后的媒体采访上 ,良多媒体也在讯问腾讯这么晚掏出大模子 ,那以及市面上的竞品们有甚么优势  。

腾讯方面则是说,混元大模子在大模子饱受诟病简略受诱惑 、典型的大模子幻觉( 横三竖四 )等通病上,有了针对于性的改善 。

以是咱们在实际测试时 ,也特意留意感触了这两块内容。

不患上不说 ,混元的大模子幻觉削减较为清晰,这约莫也以及他惜字如金无关连 ,事实说多错多仍是颇有道理的。

但简略受诱惑这方面的改善着实并不清晰 ,一些该跳的坑仍是很难防止,只能说千防万防 ,夷易近意难防。

而且作为一个刚上市的大模子 ,一些小下场比起同期早已经宣告的尊长们仍是有待改善。

好比“ 重更天生 ” 谜底每一每一性会失灵,致使有的时候重启重新输入下场都无奈处置。

而当你发现混元说错了某个回覆愿望他更正 ,他总是顽强地谦厚认错,去世不更正 。

尚有便是 ,他对于一些比力重大的提问,反而无意分会抽风  ,有点像抓关键词同样作答,很让人抓狂,只能不断更正揭示词才会好点。

再吹毛求疵一点的话,这个天生下场时的头像动效 ,有种二胡卵子的颇为美感,咱也不知道这是低级呢仍是可爱呢 ?

这些小下场着实还挺频仍  ,真要列起来又有点太稀碎,巨匠仍是自己体验后会有更深入的清晰。

不外这些小倾向 ,后续的更新迭代倒也重大,等用户数多了 ,信托很快就能优化 。

总的来说 ,混元以及 ChatGPT 在中文情景下的 PK 中,两者着实水平差未多少 ,放到国产大模子梯队里 ,也能有个平均水平 。

只是在用了这么多大模子后,咱们感应混元特意之处是给人的感应 ,它更像个理工科直男,主打一个空论少说  。

而 GPT 为首的此外大模子们则是典型的文科小编 ,主打能水就水 ,油多不坏菜 。

而这种感应也更贴合腾讯对于混元大模子 “ 适用级 ” 的界说。

事实谁也不想在急着用的时候还要在扼要扼要里找关键信息吧 。

那对于差评君来说 ,混元大模子更让人期待的 ,反而是以及腾讯旗下运用的深度融会 。

如今巨匠手里没个七八九十个腾讯系运用 ,都不敢说自己在互联网上冲浪的。

尽管眼下,咱们在宣告会上只看到了腾讯团聚、腾讯文档里们的进化 。

但在这些办公软件之外 ,腾讯系里游戏、社交 、影音等等,才是更以及巨匠休闲欢喜相关的营业 。

在这些规模 ,大模子的未来会是甚么方式 、甚么水平的散漫,才更是巨匠所最期待的 。

更关键的是,在其余大模子还在苦苦试验奈何样以及营业、以及已经有运用的散漫上,腾讯却已经有了乐成履历 。

此前腾讯多模态 AI 大模子争先被运用在广告投放 ,当时累计给广告主带来 15% 的 GMV 提升。

以是,被网上吐槽的最晚宣告大模子的大厂 ,这么看起来彷佛也不是甚么飞龙骑脸的天崩时事。

好饭不怕晚嘛。

撰文:八戒 编纂  :江江 & 面线 封面 :萱萱

图片 、质料源头:

腾讯混元大模子返回搜狐,魔难更多

责任编纂:

(责任编辑:探索)

推荐内容
  • 轰31+34+41!恭喜快船赌赢,排队向威少道歉吧,但哈登还蒙在鼓里
  • 原创AC米兰夏窗进10出12,新援参与进球过半,低价签人有三大绝招
  • 20岁女大学生校内搭乘同享电动车摔伤,昏迷一月后离世
  • 凡人收集第三季度财报:营收8.24亿元,净利润4.21亿元
  • 尘埃落定!浙江队被剥夺亚冠资格悬念揭晓,来看看名记传来的消息被老虎舔一下有什么下场?看到这块冰块,瞬时起了一身鸡皮疙瘩
  • 加沙地带卫生部份:加沙一所医院产科病房遭轰炸