栏目分类
热点资讯
你的位置:最好看的中文字幕国语2019 > 99精品国产一区二区三区不卡 >
99精品国产一区二区三区不卡 对于多模态AI的三点产物视角反念念
发布日期:2023-09-02 14:58 点击次数:200
多模态AI时间被认为是AI发展的下一个要紧里程碑99精品国产一区二区三区不卡 ,具有无穷后劲。本文将辩论多模态AI在需求定位、时间旅途和产物联想方面的关键问题,并建议有关念念考和建议。

最近《后GPT期间,多模态是最大的契机》一文中,行业前辈王安分提到,多模态AI的凹凸游任务与时间路子之间,会有陈列组合游戏,处于爆发的早期……是大模子科研与工程界限最好的弯谈超车契机。
对于多模态,我个东谈主应该是业内最早存眷到的从业者之一(至少6年前)。本文,将从需求定位、时间旅途、产物联想三方面、来共享一些AI产物司理视角的反念念。
媒介:六年前的“多模态”还相对浑沌(PPT+专利+demo)在2017年4月的200页PPT《东谈主工智能产物司理的新来源》中,我说起过“多模态”,如底下2张图:


在2017年10月的120页PPT《产物视角下,现阶段的AI若何落地》中,也共享过Andrei Cheremskoy建议的“组合矩阵”本领,能系统性推敲深度学习的诈欺契机。

一样在2017年,我写了专利“多模态编造机器东谈主的实验生成的本领和系统”。

致使在2016年4月,我还在儿童机器东谈主上,作念过“中英文混杂对话”+“多模态交互”的最低级demo。(可能是以前时间条款下的最好demo后果了,最近在星球里共享了其时的演示视频,对于多模态,我个东谈主是招供这个大标的的;底下,仅是想从产物视角,共享些不同的默契,供环球详尽参考。
一、需求定位:若何隐私“拿着锤子找钉子”的风险?正面看,很容易以为陈列组合的契机点太多了,容易有过于“理所应当”的风险。此时,可能更需要从产物/需求视角动身,望望我们到底有哪些非共鸣的行业know-how。
最近,我共享的《大模子期间,产物司理的什么智商会成为稀缺(1)》一文中提到:
这一波AI 2.0,一定不是浅易的ChatGPT化、CUI化。而是需要先把业务吃透,再看不错若何借用AI、对话式交互的智商来处分问题。
就像出动互联网期间,不是把web实验浅易搬成功机app上。
当今,也不是智能汽车那种浅易的“所见即可说”,一升引语音操控的面容兑现一遍。
行动产物司理,一启齿,一定不要只是是what层面的“不错作念什么”。
行动产物司理,一启齿,就要说场景、用户、需求、细节、你有什么非常的细察等等这些。
莫得why和how救援的what,莫得道理。
这背后,更实战的干货默契,是我在《AI创业公司的妄念:招个AI产物司理来想idea》等共享的这几段话:
雇主/部门崇敬东谈主们,以为我方需要能提供好点子(idea)的产物司理,但其实果真需要补王人的,是“垂直界限内的需求默契”。
为什么呢?因为假定“恰好”意料了好的点子(标的和需求定位),但淌若莫得深度的行业默契,雇主(和其他东谈主)也根底不知谈若何默契评估这个idea是否靠谱、以及为什么。
即使公司粗犷插足一定资源去作念MVP,仍然95%的概率会因为搞不明晰事情的关键点、最中枢的联想是啥,而错过契机——浅尝辄止的把形状砍掉,直到1、2年后再后悔莫得抓续插足。
环球不错回顾下我方地点公司/形状,是否经历过这种事?
是以,产物司理是需要有行业know-how(垂直界限内的需求默契),在“某个需求点是果真存在照旧伪需求”这种问题上,平直给团队谜底的,让环球少走弯路,以及在关键方案局势,还好像扛住雇主的压力、坚抓我方的判断。
前边《后GPT期间,多模态是最大的契机》原文中提到,“平凡用户的想象力是用之束缚的。惟有有更好的抒发面容和更浅易的器用,用户就一定能再次创造数字实验的新风潮。……根底矛盾在于,刻下的时间器用无法称心用户欢叫的创造需求……平凡用户很难借鉴。”
从产物默契看,我个东谈主对此是存疑的。因为对于大大宗平凡用户,可能并莫得那么大的“创意/想象力”智商,也莫得那么强的需求贫苦度去“阐扬创意”。
截止视角,也许会存在“高傲出想象力后果”的情况,然而,原因不一定是“器用”,还可能是因为“用户+AI器用+社区”,访佛Midjourney那样。
果真有更大、更明确需求的,是“有私域常识库的个东谈主IP”。
在《我看到的AIGC落地契机(3)_IP常识库+ChatGPT》中,我有提到:
从产物角度看,似乎环球都容易意料这个点;从时间角度看,惟恐间同业说,时间不是门槛,数据才是。
光从外表上来看,土留午的设计也是非常的新颖,他的身躯是被绿色的植被和石柱覆盖的,这样也算是表达他沉睡这么多年为什么都没有被人类发现,因为把头部藏起来的话,土留午就和正常的山丘没有什么两样,甚至就连地球防卫队GGF与SKaRD都没有发现他,所以才会在他的身躯上进行新型兵器的演习,但是这也算是吵醒了他。所以说,这次的怪兽苏醒算是人类的责任。
山怪兽土留午是流传千年的守护神,一直都在沉睡中。因为他的原因,这片徒弟非常的肥沃、水质也是非常的甘甜,这全部都是土留午的功劳。但是因为他身躯上的神社被摧毁,所以他才从沉睡中苏醒。加上防卫队又在这里进行新武器的实验,并且新武器两门麦加炮还在插在土留午的身躯上,这也让他彻底的苏醒。苏醒后的他使用肩上送来的卖加炮攻击阿斯加隆,但是被躲避了,只不过他尖角上汇聚出金色的闪电,成功的让阿斯加隆死机。之后土留午开始大口的喝水,随后又陷入了沉睡中,并且鼻涕都冒泡了。
我想说的是,数据是中枢壁垒之一,但这事成败要素,更在于“对IP实验生意的know-how”。
我作念AI产物司理社群赶紧6年了,直到最近泰半年,我才开动明显,IP智商和专科(实验)智商,其实是2个不同维度的东西。这个寰宇里,专科牛东谈主非常多,但能基于实验赚到钱的专科牛东谈主并未几;许多粉丝量很大的IP/自媒体,其实并莫得那么得益。
原文中,谄媚自身6年IP社群运营履历告戒,我最终意料了3个貌似讲得通的产物/生意定位。
想作念这个标的的时间或产物同业推断不少,但淌若莫得这方面的切躯壳验,可能会走一些弯路。
二、时间旅途:需要继续把模子(和数据)变大?原文提到:“将这种智能范式推广到三维、四维的时空范围,复杂度的增长是指数级别的。因此,在视频、3D、动画序列等较文、图更复杂的多模态界限,时间迭代并管制到一个大一统本领的时期周期可能会相配长,三至五年只是我的保守推断。”
对这点,好像也有点存疑。不仅因为
1. 当今也曾是大真金不怕火钢铁的景色了,资源铺张稠密,再加码的话,不合劲。
2. 本来许多从业者就认为,“小样本”学习,才是果真智能的属性之一。
3. 本来许多东谈主认为“多模态”是必须的,但OpenAI的使命和默契告诉我们,在文本层面“瞻望下一个字符”,“压缩遵守”就约等于/等效于“泛化遵守”。致使不错说,在“心”的层面,文本/图像/视频本人等于“全息/等效”的。
况兼,公开报谈中有过有关的细节:
1、OpenAI首席科学家Ilya Sutskever:考研模子一定会在某个时刻,用完悉数 tokens,到那时,就需要其他本领来考研模子,而不是更大宗据……我(Ilya)对多模态性的必要性的办法:它并非必须,但富余有效。这是一个值得追求的好标的,我只是不认为应该将它们分得如斯明确。
2、OpenA纠合独创东谈主Greg Brockman:一般以为问题在于考研数据太少,但我们惟恐俄顷意志到,原本问题出在基本假定上(从第一性道理动身)。
诚然,原文中作者也提到,“也许必须遴荐新算法联想来处分复杂度爆炸的问题。或者,因为模态间常识迁徙的可能性,让AI愈加深远确认考研数据丰富的低维度文、图信息,一定不错匡助AI更快地从高维度信息中学习常识。”
三、产物联想:有莫得新的默契或本领论?AI 2.0期间,一定会有新的产物联想念念路或宗旨,比如《AI产物本领论之“由用户来完成AI产物联想的终末一公里”》。
对于多模态,刻下业内还莫得千里淀可供参考。
我也只是也曾有个有关的灵感点:在特别场景下,任何单一模态disable了,举座还不错继续交互——类比4个引擎的飞机,坏了一个,还不错继续飞!

专栏作者
hanniman,微信公众号:hanniman,东谈主东谈主都是产物司理专栏作者,前图灵机器东谈主-东谈主才计谋官/AI产物司理,前腾讯产物司理,10年AI履历,13年互联网布景;作品有《AI产物司理的实操手册》(AI产物司理大本营的4年1000篇干货合辑)、200页PPT《东谈主工智能产物司理的新来源》。
题图来自Unsplash,基于CC0合同。
该文不雅点仅代表作者本东谈主99精品国产一区二区三区不卡 ,东谈主东谈主都是产物司理平台仅提供信息存储空间就业。