微知上的内容比本日头条优良多了。

只要英文版最智能。

但是,微知的日流量只要6500多万,本日头条却高达2.8亿。就是因为微知的内容太好了,头条的内容很能哗众取宠广博众的眼球。

做内容,始终是紫微星在国表里市场都在尽力生长的一个方向。

文心一言想要表达得智能一些,就不能对接中文的语料,要去对接英文的练习数据才行,然后背后再增加一套翻译算法和内容检查算法。

将来的互联网市场,归根结底是内容为王。

对方的这个发起,还真是能够考虑。

闲谈的最后,两人谈到了长生不老的话题。

就像利用文心一言,让他画一个起重机的图片。

如果一开端就只供应一条路,那还练习个屁啊,不给AI挑选、评判、思虑和阐发的机遇,就只奉告他一个标准答案,AI就会毫偶然义。

就比如,《大期间之巅》到底是一本如何的书?

以是当百度的文心一言推出以后,就会呈现很多令人难以了解的事……实在启事很简朴,文心一言利用的是英文数据,中文语料的数据实在是太少了。

就像滞销的牛奶。

周不器似笑非笑,“要投资多少钱?”

这就很让人费解。

拉里·佩奇对此很感兴趣,“等敲定了推特的案子,接下来一个方向就是要让董事会批准,去尝试在这个范畴做一下。”

这就需求一些弱势说话的AI模型,要有说话转换才气,去转换成英文。

绝对是互利互赢的买卖。

“维基百科更像是一个词典,内容都比较根本,是偏大众的产品。Knol是由一部分有才气的权威用户来共同合作,用来解释一件事物的是甚么、如何做、启事颠末成果及其周边事物,并且说明作者的实在质料,从而让内容更加地精准、权威。”

如果作者想要保护批评区的调和,把统统说好的内容都留下了,说差的内容都删除了,最后只剩下了一片赞歌,那么即便这些赞歌都是对的,这也是渣滓信息。

以是,想练习出天下级的AI模型,就只能用英文语料来练习。

因为对AI模型来讲贫乏了多元化的评判。

成果画的是鹤。

这些数据里,有些是开源的大众数据,全天下都能够用。有一些是私稀有据,只要本身能够用。

就像生物制药,有一万种挑选,AI帮手给出最好的那几个挑选,就会大大地缩减研发经费、进步研发胜利率。

这便能够让爱斯达在稀释划一股分的环境下,融到更多的钱。

“当然。”

就剩下了一堆没法练习AI的渣滓内容。

拉里·佩奇接着发起,“我手里有一款产品,做得不太好,但我以为这个方向是对的,并且跟紫微星的很多产品相符合。你如果需求的话,能够拿走;如果不要,我就会在几个月内封闭这个停业。”

外洋市场并没有如许的产品。

与此同时,爱斯达这边也会受益。

拉里·佩奇口气很大,“20亿美圆吧,资金太少也没需求让董事会批准。我筹算建立一家专门处置生物研讨范畴的子公司,用于抗朽迈的相干研讨,目标是实现人类长命乃至长生。”

因为其他说话的数据量太小了,练习出的模型就不敷智能。

这些都是私稀有据,都有能够成为紫微星在未来天下合作中最贵重的资产。

甚么说话都有,90%以上都是英文的语料库,中文语料数据也就是2%摆布。

这就很有讲究了。

拉里·佩奇道:“Knol,晓得吗?一款旨在跟维基百科合作的产品,07年研发、08年上线,但是做了几年,成绩不是太好。谷歌现在的核心计谋是做交际,一些用心又表示不好的产品,都会连续关掉。”

接下来,拉里·佩奇又提到了云计算的技术方向的挑选,这但是奥妙,周不器不能随便胡说,就以本身是技术内行,甚么也不懂给敷衍畴昔了。

以是,周不器对内容很首要,特别是外洋的英文内容。

如果不算微软、三星这些不以手机制造为核心停业的公司,那么爱斯达就是目前环球仅次于苹果的第二大手机制造商了。

周不器此前跟周绍宁相同过,爱斯达现在的市场估值能够达到350亿美圆,诺基亚现在的市值才是327亿美圆。

谁有内容谁就有制霸权。

别看国浑家多,但收集上真正有代价的内容实在未几,略微特别一点,这些有代价的语料就要按法律法规给删除了。

维基百科实在是太强大了。

爱斯达已经落空了参考工具,只要估值不超越苹果、微软、三星,估值是350亿美圆,还是450亿美圆、550亿美圆,能有多大的不同?

信息的精确性、实在性,实在一点都不首要,大众底子不在乎本相,只在乎表象。这就会构成一种“越大众,越提高”、“越权威,越小众”的征象。

拉里·佩奇坦言道:“当然,要跟野生智能关联起来。现在人类每研讨出一款蛋白质的服从,能够都要由几十位医学专家花上千万美圆才气研讨出来。如果AI生长起来了,完整能够一次性地把全人类统统已知蛋白质的服从都给破译出来。”

“你也会参与吧?AI在窜改天下。”

德文、法文、日文、韩文的数据量太少,中文的数据量很大,但是因为环境的限定有代价的数据也很少。

环球有一个超大型的免费的数据库。

想要?

周不器一下就听明白了Knol这款产品失利的启事。

谷歌股价猛涨,拉里·佩奇意气风发。

我直接倒进臭水沟里。

用英文向ChatGPT发问,答复的速率会非常快,并且精确度极高;如果用中文、日文、韩文、法文、德文等其他说话来发问,反应速率就会很慢,给出的答案也会弊端百出。

连谷歌都承认爱斯达如许的超高估值了,其他的风投机构,有甚么来由不承认?以是当爱斯达再启动新一轮融资的时候,便能够用谷歌为跳板,开出更高的报价了。

得费钱买。

周不器问:“跟IT相连络?”

以是,想做出一款巨大的AI产品,除了在野生智能范畴的顶尖算法以外,另有很首要的一个身分,就是练习AI模型的数据。

“维基百科的竞品?”周不器还真是挺感兴趣,“详细说说。”

如果有人说好,有人说不好,这些内容就都是有代价的内容,AI模型颠末一番的练习和评价,从而给出比较客观公道的评价。

环球几近统统的AI模型,想要练习都要依托着这些公开的数据内容才行。因为都是英文数据,以是这些AI模型,必然都是以英文为核心。

就像紫微星在海内的两款产品,微知和本日头条。

周不器才不会听他说得这么好听,谷歌是上市公司,公司的资产可不能随便送人。紫微星如果想要这款产品,必然得费钱买才行。

在海内,紫微星有微点百科,供应近似维基百科类的办事。

如果拉里·佩奇说的这款Knol真的是对标维基百科的产品,那就太成心义了。维基百科是公稀有据,Knol就是私稀有据。

如果爱斯达的估值高了,那么在摩托罗拉手机停业的买卖案里,谷歌能够拿到“一大笔钱”,然后扬眉吐气。

两人又颠末端简朴的交换,周不器对Knol这款产品兴趣越来越浓,筹算转头先去研讨一下。如果合适,无妨就买过来,加以改革。

“甚么产品?”

ChatGPT一样会碰到如许的窘境。

谷歌想把Knol打形成一款有权威级的内容产品,立意很高、志向很大,但想要收成充足多的用户,那还是难了点。

从解缆点到起点,有一万条路,AI模型的练习就是把这一万条路都走一遍,然后选出最合适的那条路,这才是AI的代价。

幸亏两年前周不器曾批准了一笔买卖,紫微星国际收买了一家内容产品平台Quora,也就是传说中的“美版知乎”。

像微软、谷歌、Facebook这类硅谷的巨擘公司,除了能够利用庞大的公稀有据外,另有庞大的有代价的英文私稀有据能够利用,他们做出来的AI模型就会比只按照公稀有据练习的AI模型要更加强大。

又比如“可乐鸡翅”这类,放在中文语境里,实在很好了解,就是一道菜。但是,这内里有一道翻译的手续,把“可乐鸡翅”翻译成英文,在翻译过程中就形成了信息离散,导致画出来的可乐和鸡翅。

但是,数据是不能乱花的,只要公开数据或者开源数据,才气免费地供环球的开辟者利用。

吹泡泡,公然是本钱市场里的一大利器!

包含将来的野生智能大说话模型也是。

周不器竖起一根大拇指,“有寻求。”

就比如ChatGPT、文心一言这类的AI产品,想要有令人惊人的智能表示,就必然得颠末无数数据内容的练习才行。

不买?

实在很简朴,起重机的英文是crane,而crane在英文里主如果指鹤。以是AI模型就画出了鹤的图片。

拉里·佩奇做了一个简朴的比较。

Tip:拒接垃圾,只做精品。每一本书都经过挑选和审核。
X