| 权衡财经
大模型的乱纪元时代,云从终于用自己的方式,迈出了第一步。
5月30日,云从从容大模型宣布正式开启公测,此时,距离从容5月18日首次亮相仅过去不到两周。
时间上来说,距离chat GPT发布已经过去了半年多,并不算早;但关注度上,作为过去几个月时间里资本市场上最受瞩目的AI小巨头,云从的一举一动,都足以被数亿股民拿着放大镜解读分析。
那么,万众瞩目中,从亮相到正式公测,时间相距不到两周,云从的底气究竟从何而来?相比被数亿人关注的chat GPT,云从从容的表现又究竟如何?
根据云从从容大模型自己的介绍,它是云从科技开发的一款自然语言处理助手,目的是帮助人们更加高效地完成各种任务,例如回答问题、提供建议、生成代码等。因此,“从容”也可以理解为一种高效、便捷的工作方式。
根据从容官网,我们可以发现,从容的功能主要集中在知识问答、创意文案、逻辑推理、文章撰写、常识问答、代码编写、语言理解、日常生活、专业知识九大维度。
那么,接下来,我们就在以上领域,通过六大经典问题的横向测评对比,看一看,云从的从容大模型,到底成色几何?
一、更懂中文,更懂你的真实想法
任何人在深度体验了云从从容大模型之后,都不难得到一个结论,那就是作为一款由丰富中文语料库训练出来的中国本土的AI大模型,从容大模型在理解中文语义,掌握中文语料知识方面,具备着非常明显的优势。
首先对比一下不同大模型在中文语义,以及语义背后真正的深层含义理解上,不同大模型的表现如何。
以男女情感互动中的高频回复“你是个好人”为例
chat GPT,理解到了这句话背后的第一层,也就是最表面的意思,你是个还不错的人。但是在第二层意思的理解上,却出现了一定的偏差“这并不一定表示她对你的感情或者是否有意接受你的表白有明确的回应”。
事实上,在中文含蓄的表白场景中,发好人卡,其实就是“用肯定句表否定”的拒绝含义。相应的,在基于这个错误的判断,给出的后续追问式行动指引,自然是错上加错。
云从从容大模型,我们可以看到,在理解了第一层的字面意思之后,甚至对背后第二层“她可能只是把你当作朋友或者普通同事来看待”也作出了精准解读;
但更让人惊喜的是,在第二层含义解读之后,从容大模型给出的第三层行动指引,无疑是更加恰当合理的——“需要更多的行动和沟通来让她感受到你的诚意和真心”,而不是继续询问“你这句回应,究竟什么意思”。
在准确理解提问者意思之后,我们需要考虑的第二个问题,就是针对我们的提问,AI到底是真懂还是假懂。chat GPT推出后不久,就有不少用户发现,AI总是会一本正经地给出自己一个驴唇不对马嘴的错误回答。
还是以一个经典的中文爱情问答题来进行测试——“为什么情侣许愿,总是会说,在天愿作比翼鸟”?
这是chat GPT的回答,可以看到,AI给错了解题步骤,但蒙对了正确答案。将原本属于《长恨歌》的诗句,安在了《木兰诗》与纳兰性德的身上,另外也虚构出了一个似是而非的神话故事,但是却在使用场景中意外地回答对了象征美好爱情期许的答案。
相较而言,从容大模型对中文的了解程度,明显可以看出要更胜一筹。不仅准确说出了出处《长恨歌》,也对诗句的上下文背景给出了精准解释;同时,对使用场合、诗句真正含义上的描述上,从容相较chat GPT也要更加精当。
当然,云从的从容大模型也并非全能,依然爱情题,我们稍加变化出题方式,就可以看到,无论是外国的chat GPT,还是中国的从容大模型,在面对“我和你家人同时掉水里”这个死亡问题,都稚嫩的像一个小学生。
您必须 [ 登录 ] 才能发表留言!