手机浏览器扫描二维码访问
孟繁岐的这番话,听起来让人觉得不是那么舒服。
言下之意,给人一种华国aI技术就是不如国外的感觉。
这是李彦弘不大喜欢的,毕竟他这么早就关注aI技术,就是为了研最前沿最先进的技术。
孟繁岐大概猜到了他的想法,前世他也曾被早期华国大量表的aI论文所迷惑。
觉得在这个崛起的技术上,华国已经可以和美国分庭抗礼,不落下风。
虽然a1phago震惊了世人,但毕竟有些华而不实。
直到上千亿级别的语言大模型出现,这种纯硬核实力的比拼,让孟繁岐不得不甘拜下风。
实际上,并非是技术手段和算法层面上相差太远。
更多的还是因为优质数据的数量不足。
白度的文心一言,出图的时候甚至会将用户的中文输入翻译成英文,再去作图。
很多较真的网友故意测试了中英文差异很大的词汇,比如总线(Bus),鼠标(mouse)。
文心一言绘出的图像竟然是大巴车和老鼠,这从中文上是完全说不通的事情。
可见即便不是全部,文心一言这个所谓的专注中文的级大模型,也在相当程度上借助了英文基础的模型权重和技术。
究竟为何要这么做,说到底还是基础不够扎实牢靠。
整理数据,清洗数据,给数据打上高质量的标签。
这些都是脏活累活,见效慢的工作。
把别人公开的数据拿过来跑一跑训一训,多么方便快捷?
以国内996大厂的内卷风气,很难容下长回报周期的基础建设。
早些时候看看不出区别,只觉得国内大厂频繁在xx榜单上露面,刷榜,又是过这个,又是过那个。
直到语言大模型阶段,基础语料数量和质量上的劣势才暴露无遗。
“其实这也不能完全怪华国的大厂风气,美国的互联网起步要早,并且很多领域的文献材料归档做得特别好。”
孟繁岐也曾仔细思索过这方面的问题。
“像github,arxiv这样的大型公开社区,里面都是非常优质的外文代码或者论文。这些也不只是美国人自己的积累。而是通过免费公用的形式,收割了全世界的数据。”
“华国人在github上贡献的代码行数也不在少数,反过来看看华国的论文社区,就比如知网,纯纯就是毒瘤。里面屯点硕博生的论文,还要论页数收费。就连下载之后的阅读器,甚至都需要专门的....”
此消彼长之下,差了多少珍贵的数据啊...
只是此时此刻,李彦弘应该还没有想到这么大规模的数据用于训练。因而孟繁岐也不急于一时和他讨论后面语言类的技术,以及生成式的大模型。
最近一两年内,孟繁岐的重心还是在视觉图像算法这边。
“李总,我个人相信aI技术的开源程度是相对的,不可以一直这样透明下去。只是最后成为壁垒的可能并不是模型本身这个纯技术范畴,更多的可能是计算能力,高质量的大规模数据,以及一些精髓的训练与反馈方式等等。”
(诡怪世界)(肉身无敌)(无女主)(养成系)(体内空间)满是诡怪的世界,却无法成为诡修!只好开挂的林枫以肉身镇压诡怪,再让其为自己修行!水诡,刀诡,子母将军诡,怅诡,青竹藤诡,石像诡,阴啸诡诡怪真的有点多呀!镇诡司,我让诡怪助我修行!...
表面上是顶级流量小花,实际上却是世界上最后一个山神,为了不像前辈一样消散于世间,她白天拍戏拍综艺攒粉丝攒信仰,晚上捉鬼捉僵尸攒功德。简直忙死了在这个时候,十年前睡过的男人却带着遗留历史问题找上了门...
山清水秀出美人,却偏偏出了个小刁民。王二蛋与嫂嫂同住一片屋檐下,却常常捂腰长叹夜色虽美,可护着腰才是重重之重。各位书友要是觉得农家刁民嫂嫂,请自重还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...
简介关于闪婚也甜蜜,嫁个糙汉队长生崽崽三十岁的刑警队长江澈颜值不输明星,一身肌肉块。然而,警局内部有传言江队对女人没兴趣。后来,江队的行为越来越反常。有一天,同事们突然杀到江队家敲门,结果看到光着膀子系着粉色围裙的江澈拿着铲子出来开门有话快说有屁快放,媳妇等着吃饭呢。二十岁的乔鸢刚毕业工作就闪婚,而且还是嫁给一个比自己大十岁的老男人,医院里的同事得知她老公是穷警察,经常不着家,就都劝乔鸢趁着年轻有姿色,赶紧离婚吧,找个有钱的富二代才靠谱。另一边,警队的人见到乔鸢后大为震惊,也劝江澈那么年轻漂亮的姑娘,心思肯定不会留在你身上,趁着你俩还没孩子,赶紧离婚吧,找个同龄温柔贤惠的才会过日子。可是后来,大家现,他们生了一胎不久又生二胎,接着又备孕三胎乔鸢挺喜欢孩子的,但是生娃之前一直担心养不起,结果她生完大宝还没出院,江澈的爷爷就送给她一套价值过亿的豪宅,还宣布这个孩子是豪门继承人排雷感情流,主打男女主日常小甜饼,关于男女主职业相关内容都是虚构,请勿较真。...
新作品出炉,,希望大家能够喜欢。本作品为影综世界,与现实无关。如有雷同,纯属巧合。小白作者第一次写书,写的不好或不合理的地方,请各位读者见谅。从四合院到港岛大亨...
作品简介(关键词东京恋爱日常美少女狗粮不戾气)你好,北条诚,恭喜你获得了美少女游戏唯一的内测资格,这款游戏需要玩家投入真心,才能得到真正的收...