大时代之巅_荒野悲歌_第2045章 AI改变世界

微知上的内容比本日头条优良多了。

只要英文版最智能。

但是，微知的日流量只要6500多万，本日头条却高达2.8亿。就是因为微知的内容太好了，头条的内容很能哗众取宠广博众的眼球。

做内容，始终是紫微星在国表里市场都在尽力生长的一个方向。

文心一言想要表达得智能一些，就不能对接中文的语料，要去对接英文的练习数据才行，然后背后再增加一套翻译算法和内容检查算法。

将来的互联网市场，归根结底是内容为王。

对方的这个发起，还真是能够考虑。

闲谈的最后，两人谈到了长生不老的话题。

就像利用文心一言，让他画一个起重机的图片。

如果一开端就只供应一条路，那还练习个屁啊，不给AI挑选、评判、思虑和阐发的机遇，就只奉告他一个标准答案，AI就会毫偶然义。

就比如，《大期间之巅》到底是一本如何的书？

以是当百度的文心一言推出以后，就会呈现很多令人难以了解的事……实在启事很简朴，文心一言利用的是英文数据，中文语料的数据实在是太少了。

就像滞销的牛奶。

周不器似笑非笑，“要投资多少钱？”

这就很让人费解。

拉里·佩奇对此很感兴趣，“等敲定了推特的案子，接下来一个方向就是要让董事会批准，去尝试在这个范畴做一下。”

这就需求一些弱势说话的AI模型，要有说话转换才气，去转换成英文。

绝对是互利互赢的买卖。

“维基百科更像是一个词典，内容都比较根本，是偏大众的产品。Knol是由一部分有才气的权威用户来共同合作，用来解释一件事物的是甚么、如何做、启事颠末成果及其周边事物，并且说明作者的实在质料，从而让内容更加地精准、权威。”

如果作者想要保护批评区的调和，把统统说好的内容都留下了，说差的内容都删除了，最后只剩下了一片赞歌，那么即便这些赞歌都是对的，这也是渣滓信息。

以是，想练习出天下级的AI模型，就只能用英文语料来练习。

因为对AI模型来讲贫乏了多元化的评判。

成果画的是鹤。

这些数据里，有些是开源的大众数据，全天下都能够用。有一些是私稀有据，只要本身能够用。

就像生物制药，有一万种挑选，AI帮手给出最好的那几个挑选，就会大大地缩减研发经费、进步研发胜利率。

这便能够让爱斯达在稀释划一股分的环境下，融到更多的钱。

“当然。”

就剩下了一堆没法练习AI的渣滓内容。

拉里·佩奇接着发起，“我手里有一款产品，做得不太好，但我以为这个方向是对的，并且跟紫微星的很多产品相符合。你如果需求的话，能够拿走；如果不要，我就会在几个月内封闭这个停业。”

外洋市场并没有如许的产品。

与此同时，爱斯达这边也会受益。

拉里·佩奇口气很大，“20亿美圆吧，资金太少也没需求让董事会批准。我筹算建立一家专门处置生物研讨范畴的子公司，用于抗朽迈的相干研讨，目标是实现人类长命乃至长生。”

因为其他说话的数据量太小了，练习出的模型就不敷智能。

这些都是私稀有据，都有能够成为紫微星在未来天下合作中最贵重的资产。

甚么说话都有，90%以上都是英文的语料库，中文语料数据也就是2%摆布。

这就很有讲究了。

拉里·佩奇道：“Knol，晓得吗？一款旨在跟维基百科合作的产品，07年研发、08年上线，但是做了几年，成绩不是太好。谷歌现在的核心计谋是做交际，一些用心又表示不好的产品，都会连续关掉。”

接下来，拉里·佩奇又提到了云计算的技术方向的挑选，这但是奥妙，周不器不能随便胡说，就以本身是技术内行，甚么也不懂给敷衍畴昔了。

以是，周不器对内容很首要，特别是外洋的英文内容。

如果不算微软、三星这些不以手机制造为核心停业的公司，那么爱斯达就是目前环球仅次于苹果的第二大手机制造商了。

周不器此前跟周绍宁相同过，爱斯达现在的市场估值能够达到350亿美圆，诺基亚现在的市值才是327亿美圆。

谁有内容谁就有制霸权。

别看国浑家多，但收集上真正有代价的内容实在未几，略微特别一点，这些有代价的语料就要按法律法规给删除了。

维基百科实在是太强大了。

爱斯达已经落空了参考工具，只要估值不超越苹果、微软、三星，估值是350亿美圆，还是450亿美圆、550亿美圆，能有多大的不同？

信息的精确性、实在性，实在一点都不首要，大众底子不在乎本相，只在乎表象。这就会构成一种“越大众，越提高”、“越权威，越小众”的征象。

拉里·佩奇坦言道：“当然，要跟野生智能关联起来。现在人类每研讨出一款蛋白质的服从，能够都要由几十位医学专家花上千万美圆才气研讨出来。如果AI生长起来了，完整能够一次性地把全人类统统已知蛋白质的服从都给破译出来。”

“你也会参与吧？AI在窜改天下。”

德文、法文、日文、韩文的数据量太少，中文的数据量很大，但是因为环境的限定有代价的数据也很少。

环球有一个超大型的免费的数据库。

想要？

周不器一下就听明白了Knol这款产品失利的启事。

谷歌股价猛涨，拉里·佩奇意气风发。

我直接倒进臭水沟里。

用英文向ChatGPT发问，答复的速率会非常快，并且精确度极高；如果用中文、日文、韩文、法文、德文等其他说话来发问，反应速率就会很慢，给出的答案也会弊端百出。

连谷歌都承认爱斯达如许的超高估值了，其他的风投机构，有甚么来由不承认？以是当爱斯达再启动新一轮融资的时候，便能够用谷歌为跳板，开出更高的报价了。

得费钱买。

周不器问：“跟IT相连络？”

以是，想做出一款巨大的AI产品，除了在野生智能范畴的顶尖算法以外，另有很首要的一个身分，就是练习AI模型的数据。

“维基百科的竞品？”周不器还真是挺感兴趣，“详细说说。”

如果有人说好，有人说不好，这些内容就都是有代价的内容，AI模型颠末一番的练习和评价，从而给出比较客观公道的评价。

环球几近统统的AI模型，想要练习都要依托着这些公开的数据内容才行。因为都是英文数据，以是这些AI模型，必然都是以英文为核心。

就像紫微星在海内的两款产品，微知和本日头条。

周不器才不会听他说得这么好听，谷歌是上市公司，公司的资产可不能随便送人。紫微星如果想要这款产品，必然得费钱买才行。

在海内，紫微星有微点百科，供应近似维基百科类的办事。

如果拉里·佩奇说的这款Knol真的是对标维基百科的产品，那就太成心义了。维基百科是公稀有据，Knol就是私稀有据。

如果爱斯达的估值高了，那么在摩托罗拉手机停业的买卖案里，谷歌能够拿到“一大笔钱”，然后扬眉吐气。

两人又颠末端简朴的交换，周不器对Knol这款产品兴趣越来越浓，筹算转头先去研讨一下。如果合适，无妨就买过来，加以改革。

“甚么产品？”

ChatGPT一样会碰到如许的窘境。

谷歌想把Knol打形成一款有权威级的内容产品，立意很高、志向很大，但想要收成充足多的用户，那还是难了点。

从解缆点到起点，有一万条路，AI模型的练习就是把这一万条路都走一遍，然后选出最合适的那条路，这才是AI的代价。

幸亏两年前周不器曾批准了一笔买卖，紫微星国际收买了一家内容产品平台Quora，也就是传说中的“美版知乎”。

像微软、谷歌、Facebook这类硅谷的巨擘公司，除了能够利用庞大的公稀有据外，另有庞大的有代价的英文私稀有据能够利用，他们做出来的AI模型就会比只按照公稀有据练习的AI模型要更加强大。

又比如“可乐鸡翅”这类，放在中文语境里，实在很好了解，就是一道菜。但是，这内里有一道翻译的手续，把“可乐鸡翅”翻译成英文，在翻译过程中就形成了信息离散，导致画出来的可乐和鸡翅。

但是，数据是不能乱花的，只要公开数据或者开源数据，才气免费地供环球的开辟者利用。

吹泡泡，公然是本钱市场里的一大利器！

包含将来的野生智能大说话模型也是。

周不器竖起一根大拇指，“有寻求。”

就比如ChatGPT、文心一言这类的AI产品，想要有令人惊人的智能表示，就必然得颠末无数数据内容的练习才行。

不买？

实在很简朴，起重机的英文是crane，而crane在英文里主如果指鹤。以是AI模型就画出了鹤的图片。

拉里·佩奇做了一个简朴的比较。