• 2023-03-14 09:35:53
  • 阅读(13835)
  • 评论(5)
  • ChatGPT仍然在搅动人工智能(AI)风云。虽然谷歌在曩昔的两年中由于慎重的情绪未能发布Bard,让OpenAI抢占先机。但作为硅谷巨子,谷歌从来不缺少"后发先至"的决计和实力。

    当地时间3月6日,来自谷歌和德国柏林工业大学的一组AI研究人员发布了史上最大的视觉言语模型:PaLM-E。作为一种多模态具身视觉言语模型,PaLM-E能将视觉和言语集成到机器人操控中。

    这个音讯,让现已在AI出资圈深耕多年的刘天杰振奋起来。刘天杰是华映本钱董事,也是AIGC范畴的一线出资人。早在上一年下半年,由ChatGPT模型前身GPT3驱动的爱情运用——AI谈天软件Replika就走入了他的视野,他意识到根据NLP(天然言语处理)的AI模型现已较曾经有了改变。

    在承受《每日经济新闻》记者采访时,他表明,"咱们了解,它(PaLM-E)现已跟实在国际有一些交互才干。"偶然的是,在他的料想中,ChatGPT引领的这条路子是很清楚的,他垂青的便是未来梅特勒电子天平更多各行各业可以去做AI赋能的运用,比方SaaS、RPA(机器人流程自动化),乃至是机器人。

    跟着ChatGPT及其API的发布,这一大模型死后的蓝海让许多创业公司蜂拥而至。刘天杰以为,这一波鼓起的AI浪潮与元世界、Web3有本质上的差异,互联网的生态得以重建了。但在龙蛇混杂的商场中,第一波有许多"蹭热度的",只要具有实在用户和了解用户需求的项目才干生计下来。

    ChatGPT出圈 创业者拥抱大模型

    2022年下半年,一款AI谈天软件Replika忽然火爆全球。人们惊喜地发现,与AI聊得越多,AI就越"懂"你,乃至还会提炼出用户的口气。更有意思的是,该软件的开创人在采访中表明,约有40%的用户描绘自己与AI为恋人联系。

    Replika这款谈天软件正是根据OpenAI的GPT- 3大模型,它也是ChatGPT根据的GPT-3.5模型的前身。很快,Replika就走入了刘天杰的视野。他意识到,根据NLP(天然言语处理)的AI模型现已较曾经有了很大改变,他开端重视相关范畴的出资时机。

    跟着ChatGPT的发布,以及GPT-3.5 Turbo的API敞开,AI的浪潮蔓延到各行各业,商场对此的反响可以用"狂欢"二字来归纳。在刘天杰看来,实践上,敞开API是契合预期的,这个项目本来便是开源的,此前也现已有许多人在用GPT3或许GPT-3.5的开源代码来做运用。

    不过,ChatGPT如此"出圈",仍是超出了他的预料。放眼整个AIGC范畴,"国内现在肯定是如火如荼。硅谷这股风比国内要更大,由于(国外)几个大模型都现已成熟了,美国那儿至少现已有几百上千的项目出现出来。"

    "(ChatGPT)的确加快了大众关于AIGC或许AI范畴的重视。可是,这条路进化到今日并非一蹴即至。包含ChatGPT的根底模型Transformer,实践上也是2017年就提出来了。"刘天杰告知《每日经济新闻》记者,"从2017年到今日,咱们一向在做许多的工程化作业。到今日ChatGPT有这个成果,跟之前多年的堆集是休戚相关的。"

    他向《每日经济新闻》记者泄漏,现在看到的创业者其实不仅仅是AI范畴的,其他许多范畴也在开端拥抱新的大模型以及新的AI才干。

    "咱们更多地会把这个范畴界说成AI+,而不是AIGC。意思便是,运用AI赋能给各行各业。我觉得未来这将是(一切公司的)一个根底才干。"刘天杰说道。

    贱价战略 OpenAI构建"AI飞轮"

    OpenAI在ChatGPT上的脚步显得十分自动和激动。大热刚刚3个月,ChatGPT API就高调上线了。这个API由GPT-3.5 Turbo模型支撑。HerAI App的开发者王绍此前告知《每日经济新闻》记者,接口服务定价大约是3分/1000个汉字。这一定价较GPT-3.5模型廉价90%。

    "Turbo便是加快的意思,它的反响速度是要比ChatGPT要快许多的。从底层算力上看,其实没有发生太大的改变。但本钱下降、反响速度进步,这只能阐明一件事,便是GPT-3.5 Turbo模型实践运用的参数比较ChatGPT下降了。"刘天杰说道。

    他随即向《每日经济新闻》记者解说,"比方说,你有1750亿个参数,可是你喂给它的练习集很小,也练习不出作用,会导致许多的问题,咱们称其为过拟合。所以,参数大意味着练习集要满足大。可是,参数越大并不意味着模型的体现越好,越能了解人的语义。恰恰相反的是,现在咱们都想用更少的参数练习出一个更好的大模型。"

    为什么GPT-3.5 Turbo能在更小的参数上完成更好的作用呢?"实践上,ChatGPT现已堆集了许多用户运用的实践对话集,这些对话集比较OpenAI运用无监督练习的语义集,要更精确、更高质量。"刘天杰说道,"由于,用户实践运用的对话中有上下文、有反应,搜集这些数据后再去练习模型,新的模型就会比之前更精确,就达到了用更小的参数量完成更精确的作用。

    在刘天杰看来,GPT-3.5 Turbo本钱的下降,中心的一点便是实践核算的本钱的确比之前要低,由于它的模型更准了。

    "当然,一方面也由于OpenAI自身不是一个盈余组织,而且它也需求更多的用户参加进来,去构成这种实践的对话集,再输入模型中做进一步的练习,而贱价也会导致用户量进一步的增加。"他说道。

    刘天杰表明,这便是所谓的"AI飞轮"。"用户进步了,数据变多了,模型更准了,用户天然更多了。飞轮一旦跑起来,OpenAI就能甩掉其他对手,这也是它贱价战略的一个原因。"

    生态重构 三类创业时机出现

    跟着ChatGPTAPI的敞开,调用这个接口来完成AI赋能成为许多创业公司的寻求,这种热潮难免让人想起元世界、Web3等新概念引领的风潮。许多人会问,看看两年前扎克伯格看好的元世界根深蒂固在哪儿,未来ChatGPT又会在哪儿?不过,在刘天杰看来,这一波鼓起的AI浪潮与前一段时间的元世界、Web3有本质上的差异。

    "元世界、Web3是一个分布式的东西。在这里,咱们期望互联网信息或许经济体系,都用一个分布式、加密式的方法去重构。"他向《每日经济新闻》记者说道,"但当时这一波AI浪潮恰恰相反,它会变成一个十分会集的东西,未来AI的底层才干将由有根底预练习大模型才干的几个大厂供给,其他人就在这些底层大模型上去开发运用。"

    "所以说,整个互联网的生态我以为是重构了。这有点相似于当年的云服务,由几个大厂来做云服务厂商,在云之上,你们去开发各式各样的运用。"刘天杰进一步说道。

    在ChatGPT引领的这一波AI浪潮中,刘天杰看到了三大层次的创业时机。第一类是做中文的底层大模型。"这类创业者往往都是高校出来的,比方说清华系有一大堆人在做底层大模型。但任重而道远,练习底层大模型,一是十分烧钱,二是要有满足强的算力。"他告知《每日经济新闻》记者。

    "别的,小公司搜集练习集的才干不行,而大模型的‘大’,大在它的练习集。小公司并没有堆集许多的数据。"他说道。

    第二类是中间层,比方做模型的微调、预练习;或许在底层大模型的根底上练习新模型,比方虚拟人模型。"这些模型是根据底层大模型的语义才干,然后在这个才干之上加了各种约束条件。"他说道,这里有一些创业时机,但并不算多。

    第三类是运用层,这也是大多数创业公司正在探求的路途。"现在最直接的是生成图片、文字、视频乃至3D内容。可是这些相对来说壁垒不行,由于模型也不是你的,练习集也不是你的,无非便是做一点优化的作业。"刘天杰说道。

    "当然还有更前沿的,便是科学家团队在探究实在的结局——通用智能,但这一块现在还在一个十分前期的阶段。"他向《每日经济新闻》记者介绍道。

    龙蛇混杂 用户需求才是底子

    在刘天杰的料想中,ChatGPT引领的这条路子是很清楚的,他垂青的便是未来更多各行各业可以去做AI赋能的运用,比方SaaS、RPA(机器人流程自动化),乃至是机器人。

    他现在首要重视两大板块,一是AI生成3D财物。"由于这一块有实在会掏钱的客户——游戏公司。这一块是他们的痛点,由于制造3D内容十分贵重,假如能用AI制造3D内容,是他们求之不得的。但现在大模型的才干还处理不了3D的生成,这是一个咱们会要点重视的范畴。"

    二是文字转化动作的运用。"也便是说,我用AI指挥实体的东西去履行操作,比方说机器人、RPA(机器人流程自动化)、大局的智能帮手等。这一块涉及到大模型的多模态输出和输入,是一个相对来说比较前沿的范畴,也是大模型没有彻底处理的范畴。"刘天杰解说道。

    商场太热,究竟哪些才是靠谱的项目?对此,一些出资人直言"又振奋又焦虑"。

    不过,刘天杰还没到焦虑的境地,他直言,"咱们看了太多这种新技能、新概念的比如,第一波(冲在前面的)有许多蹭热度的。从经典的盖特纳创业模型来看,新技能都会先阅历这样的工作,后边实在能运用这个技能的人才会兴起。"

    他向《每日经济新闻》记者泄漏,许多很强的创业者,例如传统大厂里边职位十分高的人,或许在科学界有头有脸的人,也都被招引进场。"国内比方说美团的王慧文、快手CTO以及某电商大厂技能负责人。"

    据刘天杰介绍,某电商大厂技能负责人提出了Transformer大模型中一个要害的技能道路,叫做多头注意力机制。"龙蛇混杂,当然有许多蹭热度的,可是也有许多很强的创业者在开端干这件事。"他说道。

    ChatGPT死后的蓝海让许多创业公司蜂拥而至。在刘天杰看来,"现在许多所谓的AIGC项目,并非这一波预练习大模型(ChatGPT)之后发生的,它的技能道路上其实跟大模型没有任何联系,相当于之前传统范式的AI上,包了一层AIGC的壳,就非说自己是大模型,但实践上跟大模型没什么联系。"

    他以为,可以落地的运用需求创业者在对应的细分工业中做实。"你要了解工业自身的经济机制和运转规矩,以及用户需求,特别用户需求永远是最重要的。由于在这里,AI仅仅供给功率的东西,它相似一个乘数。你有必要得有前面的‘1’,也便是实在的客户和客户需求。"

    来源:版权归属原作者,部分文章推送时未能及时与原作者取得联系,若来源标注错误或侵犯到您的权益烦请告知,我们会及时删除。

    12  收藏