零秒收录-网站导航-网站大全-网站目录-网站分类-分类目录-网址导航-自动收录-秒收录-0msl.com
免费加入

追一科技CEO吴悦:大模型落地,场景、成本及效果,缺一不可

文章编号:67时间:2023-12-02人气:


2006年,从中科大硕士毕业后的吴悦便加入了腾讯。2006年到2011年,在腾讯主要做存储系统研发方面,2011年到2016年专攻搜索技术。

就这样,创办追一科技之后,吴悦便主攻NLP和深度学习方向,并相继推出对话与分析AI应用平台及AIForce数字员工产品族。其中,AIForce数字员工产品族就是处理营销、服务、运营等场景任务的智能机器人,也是追一的主要产品矩阵,其包括智能在线机器人Bot、智能语音机器人Call、智能助理机器人Pal、多模态数字人Face等。

在当时来看,这一系列产品的研发并非一件易事。所以自成立之初,追一就特别注重新技术的应用,对此,吴悦也特别强调道,2017年Transformer架构,以及2018年提出的Bert架构,我们都做了相关研究。比如围绕Transformer 提出了RoPE旋转位置编码技术。被Google、Meta、阿里、百川智能等国内外大模型厂商广泛采用。

当谈到2022年底爆火的生成式大模型时,吴悦深刻地感知到了原有的技术架构已不能顺应市场的变化,以及客户的需求,所以在今年年初,追一科技便尝试在大模型技术的基础上做研究,推出了博文领域大模型,并基于大模型的能力,对现有的软件产品进行重塑。

一是沿着通用大模型的方向发展,需要不断打开大模型能力的天花板。比如OpenAI或者国内的一些大模型厂商是沿着这个方向发展的。

另一个分支是,围绕企业具体的业务场景的需求,定制化一个企业大模型。追一科技在今年年初推出的博文领域大模型属于第二个分支,就是面向企业的具体业务,比如营销、客服等场景,为企业定制一个专有大模型。

但是从目前来看,无论是通用模型还是领域模型,其挑战都非常大。通用大模型的难度主要是规模化的难度,包括参数量上规模、数据上规模和算力上规模带来的难度。而领域模型考验的则是直击客户业务痛点以及洞察客户需求的能力,但是由于业务整个链条比较长,所以这是一个非常大的挑战。

“从技术角度看,大模型确实是一个比较重要的变量,但它不是唯一的变量。”吴悦补充道。

混沌之时,GPT掀起AI新范式

吴悦:2006年,从中科大硕士毕业后就进入了腾讯。2006年到2011年,在腾讯主要做存储系统研发方面,2011年到2016年专攻搜索技术。

吴悦:有些概念需要重新厘定一下,NLP属于自然语言处理,它是人工智能三大方向之一,也是最难的方向。深度学习是神经网络,属于人工智能的一个方法论。人工智能最早解决的是视觉、语音和NLP的问题。

大模型是沿着神经网络这个方向不断发展的,2012年2013年是深度学习的一个突破,2016年AlphaGo出来,是强化学习的突破,2022年底到2023年,包括ChatGPT其实属于生成式大模型的突破,这些其实都属于神经网络的一个技术分支的不断发展的过程。

吴悦:从公司成立到今天,有三个比较重要的时间节点。

第一个时间节点:2016年创业时,我们把深度学习技术应用到对话机器人。因为之前的对话机器人大多是通过搜索或者一些规则的方式实现。当时我们就是先于其他公司,率先把深度学习技术应用到对话机器人中。这是第一个里程碑。

第二个时间节点:2017年提出的transformer架构,2018年提出的Bert架构,这些都属于大模型技术爆发前夜的阶段,当时我们就围绕transformer、Bert的架构,做了相关研究。比如围绕transformer提出了RoPE旋转位置编码技术。当时被Google、Meta、阿里、百川智能等国内外大模型厂商广泛采用。这是我们原创式的创新,也是作为一家AI创业公司为生成式大模型做得一个小贡献。当然在这个阶段,围绕Bert我们也研发出了ZOne大模型。

第三个时间节点:2022年年底GPT爆发后,我们推出了博文领域大模型,专注服务和营销领域。我们围绕四个理念打造博文领域大模型:贴合业务、合规可控、更具温度、普惠实用。

吴悦:ZOne主要是基于Bert路径,其属于表征式大模型的分支。其实大模型本质上是模型参数很大,基本上都是10亿起步,沿着这个方向衍生出了两个方向,一个是表征式大模型,典型的就是Bert。另一个就是生成式大模型,典型的就是OpenAI的GPT路径。

吴悦:2018年,这个时间节点其实是有点混沌的,当时就面临着到底是沿着表征式的方向走,还是生成式的方向走?其实都是不明确的,当时大家也都在探索阶段。直到2022年年底,2023年年初ChatGPT出来之后,大家感知到可能生成式更具有发展潜力,所以这个阶段大家都选择全面拥抱生成式大模型。当然表征式大模型在真正商业化落地过程中还是非常有作用的,所以这个方向我们也在延续做。

开源&闭源之争,开放式服务越来越多

吴悦:我们在确定做之前,背后是有一个逻辑支撑的。大模型出现后,它的应用方向或者它的发展方向,是有两个分支的。一是沿着通用大模型的方向发展,面向的是一些通用型的需求,比如终端用户的需求,这个过程需要不断打开大模型能力的天花板。典型的比如OpenAI或者国内的一些大模型厂商是沿着这个方向发展的。

另一个分支是,我们认为是围绕企业的需求,或者围绕着企业业务的具体场景的需求,定制化一个企业大模型。所以我们在今年年初推出的博文领域大模型属于第二个分支,也就是我们选择面向企业的具体业务,比如客服、营销等场景,为企业定制一个垂直领域大模型。

吴悦:博文领域大模型的研发也是阶段性的。我们现在的方向是两条路并行走,因为我们的出发点是构建一个一体化的可落地的大模型。

从落地的角度来看,有两个选择,一是围绕着开源模型,在上面做知识注入,能力增强等。另外一个逻辑就是从底层向上构建一个一体化的大模型。

从当前阶段来看,第一个阶段落地会更快一些,第二个阶段要慢一些,因为完全自研,会涉及到投入,风险等问题,所以我们还是比较谨慎地看待这件事儿。(更多关于大模型行业的相关话题,欢迎添加微信ericahss1224,互相交流,互通有无)

吴悦:我们是并行都在用,重点在于知识注入层面,能力强化层面,需要做比较多专业性的工作。这样才能够把大模型的能力充分挖掘出来。

吴悦:我觉得沿着企业级方向,可能会越来越开放,沿着通用人工方向,可能还是会坚持闭源。

吴悦:从客户的角度出发,以我们自身为例,我们服务的是中大型客户,这类企业往往会有两方面的考量:一是技术层面,二是业务层面。

从技术层面来看,中大型企业对大模型技术和产品的要求往往是非常严格的。比如安全方面,他们希望整体的数据是安全的,整体的对外提供的服务是合规的,另外还要保证大模型的输入输出是完全可控的。

从业务层面来看,真正要把大模型技术在客户的业务场景中做落地的话,其实是需要构建一个闭环的,他们要求的不仅是技术的能力,还包括如何把技术产品化,产品化完之后还需要做实施交付,这也会涉及到后续持续维护等专业服务,最重要的是,还要足够了解业务的需求,以及需求的洞察能力,这些能力其实都是非常重要的。(更多关于大模型行业的相关话题,欢迎添加微信ericahss1224,互相交流,互通有无)

大模型落地,场景、成本及效果,缺一不可

吴悦:正在逐步完成重塑中,要想全面落地到客户业务场景中去使用,明年年初能实现。我们现有的6款机器人产品已经是非常成熟的商业化产品,从2016年到现在已经服务了几百家头部客户,现在我们在尝试把大模型的能力融入到这6款产品中,贴合客户业务去做产品重塑,或者通过洞察客户业务的方式,通过大模型解决过去的产品没有解决的问题。

吴悦:要给客户做逐步推进,因为把大模型的能力加进来,大模型本身是有幻觉、黑盒或者一些其他不可控的表现,那就需要我们通过训练,自己做一个领域的强模型,帮客户避免这样的问题。

对于客户来说,过去的产品已经和他们的业务系统,做了比较深的绑定,一个大客户,每天的访问量能达到几百万甚至上千万,在大模型这个大的技术变革面前,他们是非常谨慎的。对于他们来说,业务的稳定是第一位的。所以还需要一个逐步灰度引入或者迁移的过程。

对于我们来说,首先我们要把顶层设计考虑清楚。就是到底应该怎么植入大模型,短、中、长期的规划是什么样的?时间计划是什么样的?规划性的工作其实我们已经做了大半年,基本做完了,接下来就是落地到客户业务场景中开展使用的工作。

吴悦:在这个过程中,我们说服客户是要分几个阶段的。第一个阶段,是让感兴趣的人愿意跟你聊这个话题。ChatGPT爆火,经过一些科普,我觉得只要是有大模型想法的客户,他就愿意跟你聊。所以第一阶段算是破冰了。

但是跟客户进一步聊的时候,他会问你的这套产品到底能给我带来什么?结合我的业务,到底能够帮我解决什么问题?和我现有的AI系统相比,到底能够带来多大收益?需要增加多少成本?这个问题我觉得是比较核心和关键的,所以这也是我们刚刚讲的点,就我们要去做调研,要做技术边界的定义,要做合理的计划,现在大多是在这个阶段。

吴悦:大模型是一项新技术,确实能够解决一些之前的技术所不能解决的问题。比如一句话多意图的问题,但是我们要进行大模型落地的话,其实也会引入一些新的问题,比如幻觉问题,可控生成问题,成本问题等,这些都是我们需要重点考虑的。好比电动车的技术虽然好,但大家都还会有里程的焦虑。

对于生成式大模型来说,我们觉得有两个焦虑,一是幻觉的焦虑,二是算力(成本)的焦虑。在这个技术体系里面,其实我们需要根据对客户需求的理解,以及对整个技术的设计选择合适的路径,看哪些问题适合用传统系统解决。哪一些适合用生成式大模型解决。

我们针对客户普遍关注的大模型的成本问题,提出了“增程”技术理念,具体来说,就是通过大小模型协同,共同支持客户需求,通过一个“增程器”组件,根据用户或者实际处理任务的不同,来做动态配置和组合,让大模型出现在最应该出现的地方,提升模型效果的同时,实现了性价比最大化。

吴悦:第一,比较重要的是要解决本地化部署的问题,所以博文领域大模型是要做本地化部署的,类似公有云和私有云的区别。

第二,解决成本的问题,因为我们开发的产品,在一些中大型企业中已经有了比较广泛和深入的应用。就像前面所说,如果全面换成大模型的访问,规模可能会从之前的上百万到上千万,成本是非常高的。

第三,到底能给客户带来多大的收益?这就需要对企业的业务有比较深入的洞察,能挖掘到业务的痛点,然后再提出一个既可以本地化部署,又成本可控的解决方案。这是我们发现或者所看到的一些点。

吴悦:首先,之前的产品其实是广泛解决客户的问题,但在落地过程中,我们也发现这些产品和技术是存在一些短板。这些问题是不是就可以通过大模型解决?这是我们做大模型落地的一个重要抓手,因为我们知道大模型的能力边界。

然后,我们已经有了这样的产品落地,所以跟客户,特别是头部客户形成了一个很好的联动。在这个过程中,结合追一对大模型的理解和认知,加上和头部客户共同挖掘,哪些是之前我们没做到过的,没有提供过的服务,这时,我们会重点看能不能通过大模型能不能延展到一些新的场景,这是目前我们做大模型落地的方法。

跨越大模型发展平缓期,靠的是深入业务

吴悦:大模型现在有两个发展方向,一是通用大模型,沿着通用的需求,沿着通用AI的方向发展;二是围绕着具体的应用场景出发,比如围绕企业某个场景做AI应用落地。目前,大模型技术确实已经到了应用阶段。所以大家都在关注怎么把这个技术去做落地了。

吴悦:首先,三者难度是不一样的。通用大模型是规模化上的难度,包括参数量上规模、数据上规模和算力上规模带来的难度。

应用层,如果是简单的AI创新应用,那么应用层相对独立,基于通用大模型,也足以满足。如果是复杂的AI创新应用,例如追一在做的服务和营销领域的软件产品,那么领域模型和应用层是很难分割的,他们之间是捆绑的迭代节奏,难度在于深入到客户的具体业务,深入了解具体场景和需求点,反推出大模型的能力需求,大模型的能力项和应用层产品功能一一对应。大模型的迭代带来产品的功能的不断丰富。

吴悦:竞争是一个综合方面的考量。从客户的角度看,其实客户关注的是技术如何落地,以及他们考虑的安全、合规、可控等等,当然也包括成本因素,有些客户可能也会关注,你能不能做好产品化的落地,提供相应的专业服务,然后和他们做业务的共创,所以客户是全面的考量。

(零秒收录网(公众号:零秒收录网)零秒收录网零秒收录网)



相关标签: AGI大模型GPT

上一篇:中邮通信Hinova12SE发布骁龙600系卖到2199

下一篇:雅柏威士忌多款单品价格大跌,泥煤顶流也不香

内容声明:

1、本站收录的内容来源于大数据收集,版权归原网站所有!
2、本站收录的内容若侵害到您的利益,请联系我们进行删除处理!
3、本站不接受违法信息,如您发现违法内容,请联系我们进行举报处理!
4、本文地址:http://www.0msl.com/a/67.html,复制请保留版权链接!


温馨小提示:在您的网站做上本站友情链接,访问一次即可自动收录并自动排在本站第一位!
随机文章
欺负同学被集体劝退的孩子已在家上网课多动症男孩欺负同学46名家长请愿其转学

欺负同学被集体劝退的孩子已在家上网课多动症男孩欺负同学46名家长请愿其转学

近日,多动症男孩欺负同学46名家长请愿其转学话题登上热搜榜,引发网友热议。12日,记者采访到了该校区的负责人,她表示,4月1日学校已经与家长沟通了孩子的行为,并提出希望家长先将孩子带回家去。这个孩子年仅7岁,享有受教育的权利,所以学校安排了网课,班主任每天也会关注孩子的学习。同时,学校也希望家长给孩子足够的包容,通过教育慢慢转化。

今日头条 2024-04-14 08:14:05

南通称禁止制售纸钱没提禁止使用商家称禁售纸钱如果实施大批人将失业

南通称禁止制售纸钱没提禁止使用商家称禁售纸钱如果实施大批人将失业

清明将至,江苏南通一份禁止全市制造、销售冥币纸钱等殡葬用品的通告引发热议。该份通告一经传播,迅速引发很多网友的不满。3月27日,南通12345平台回复记者称,一大早就接到了很多投诉电话,都是关于这份通告禁止制销冥币纸钱的。

今日头条 2024-03-28 08:40:55

梦到药是什么意思梦到药好吗

梦到药是什么意思梦到药好吗

每一个人都会做梦,而且有的时候梦中的场景,让我们感觉很熟悉,好像自己经历过。有人说梦具有预言性,甚至能够预知未来,也有人说梦境是内心欲望的体现。那么,梦到药预示着什么?梦里药代表什么意思?梦到药这个梦是好是坏?请随小编往下看,哪一种药梦境解析最能说服你。

周公解梦 2024-02-04 09:43:25

梦到金耳环是什么意思梦到金耳环代表了什么

梦到金耳环是什么意思梦到金耳环代表了什么

每一个人都会做梦,而且有的时候梦中的场景,让我们感觉很熟悉,好像自己经历过。有人说梦具有预言性,甚至能够预知未来,也有人说梦境是内心欲望的体现。那么,梦到金耳环预示着什么?梦里金耳环代表什么意思?梦到金耳环这个梦是好是坏?请随小编往下看,哪一种金耳环梦境解析最能说服你。

周公解梦 2024-02-04 09:40:36

梦见钱包什么意思梦见钱包意味着什么

梦见钱包什么意思梦见钱包意味着什么

梦见钱包是什么意思?做梦梦见钱包好不好?梦见钱包有现实的影响和反应,也有梦者的主观想象,请看下面由周公解梦整理的梦见钱包的详细解说吧。

周公解梦 2024-02-04 09:39:48

梦见瓦房装修是什么意思梦见瓦房装修是什么征兆

梦见瓦房装修是什么意思梦见瓦房装修是什么征兆

每一个人都会做梦,而且有的时候梦中的场景,让我们感觉很熟悉,好像自己经历过。有人说梦具有预言性,甚至能够预知未来,也有人说梦境是内心欲望的体现。那么,梦到瓦房装修预示着什么?梦里瓦房装修代表什么意思?梦到瓦房装修这个梦是好是坏?请随小编往下看,哪一种瓦房装修梦境解析最能说服你。

周公解梦 2024-02-04 09:31:11

1994年属狗人2024年运势及运程

1994年属狗人2024年运势及运程

属狗的人直率厚道,勤奋好学,沉着冷静,言行一致,做事公平,好打抱不平,愿意静听他人痛苦并分担,会引人注目和得到异性好感。最近小编有些朋友想来了解一下1994年属狗人2024年运势及运程怎么样?今天小编要分享给大家的是满满的干货。

十二生肖 2024-01-08 09:11:24

属虎女2024年下半年运势及运程有机会获得可观的收益

属虎女2024年下半年运势及运程有机会获得可观的收益

生肖属虎的女人是优秀的人,也是很迷人的人。她们性格活泼,个人能力强,喜爱时尚,能把家庭生活经营得有声有色,是众人眼中的好女人。最近小编有些朋友想来咨询一下属虎女2024年下半年运势及运程怎么样?下面是小编整理收集的内容,大家快来看看吧。

十二生肖 2024-01-04 09:39:29

属马男2024年下半年运势及运程事业运势相对平稳

属马男2024年下半年运势及运程事业运势相对平稳

属马的人一般有积极向上的性格,充满活力,他们非常热爱生命,对生活充满热情和动力。生肖马的人性格非常鲜明,冲动而倔强,通常是成功路上的佼佼者。那么,大家知道属马男2024年下半年运势及运程怎么样?以下小编为大家收集整理了一些内容。

十二生肖 2024-01-04 09:38:03

梦见钥匙代表什么梦见钥匙好不好

梦见钥匙代表什么梦见钥匙好不好

梦见钥匙是什么意思?做梦梦见钥匙好不好?梦见钥匙有现实的影响和反应,也有梦者的主观想象,请看下面由周公解梦整理的梦见钥匙的详细解说吧。

周公解梦 2023-12-31 13:12:07

睡觉梦到有人拔自己头发有哪些含义梦见有人拔自己头发代表了什么

睡觉梦到有人拔自己头发有哪些含义梦见有人拔自己头发代表了什么

每一个人都会做梦,而且有的时候梦中的场景,让我们感觉很熟悉,好像自己经历过。有人说梦具有预言性,甚至能够预知未来,也有人说梦境是内心欲望的体现。那么,梦到有人拔自己头发预示着什么?梦里有人拔自己头发代表什么意思?梦到有人拔自己头发这个梦是好是坏?请随小编往下看,哪一种有人拔自己头发梦境解析最能说服你。

周公解梦 2023-12-31 12:30:07

梦见果树预示什么?梦见果树好不...梦到果树是什么意思

梦见果树预示什么?梦见果树好不...梦到果树是什么意思

导读:每一个人都会做梦,而且有的时候梦中的场景,让我们感觉很熟悉,好像自己经历过。有人说梦具有预言性,甚至能够预知未来,也有人说梦境是内心欲望的体现。那么,梦到果树预示着什么?梦里果树代表什么意思?梦到果树这个梦是好是坏?请随小编往下看,哪一种果树梦境解析最能说服你。

周公解梦 2023-12-31 10:59:05