虽然本周自动驾驶冲高回落,但是不影响市场对自动驾驶的热度,这两天世界人工智能大会(WAIC)在上海举行,主要聚焦通用人工智能发展,马斯克的出现发言也让自动驾驶技术再一次受到关注。
特斯拉的CEO马斯克说了个预言,他说随着人工智能技术的快速发展,预计到今年年底就有可能实现全面的自动驾驶,他说的全面自动驾驶就是完全不用人类干预的自动驾驶。
(资料图片仅供参考)
人工智能带来了新的可能:人机交互
根据国际通用的标准,在不同等级的划分上,自动驾驶汽车主要是有5个等级,像L1、L2、L3、L4、L5。其中,L4是指高度自动驾驶,由自动驾驶系统在特定道路上完成所有驾驶操作,无需人类驾驶员进行任何干预。L5则是完全自动驾驶,即由自动驾驶系统完全自动完成所有驾驶操作。根据马斯克的阐述,特斯拉的自动驾驶现在做到了非常接近L4的阶段,等到2023年年底或许会达到L4或L5级自动驾驶。
自动驾驶技术国内外已经研究了很多年,根据IDC公开资料显示,从去年开始L2级自动驾驶渗透率提高的比较快,今年一季度,L2级自动驾驶在乘用车市场渗透率达到45.3%。IDC自动驾驶开发平台市场份额调查报告显示,去年我国自动驾驶平台市场规模达到近6亿元人民币,市场增速超100%。
自动驾驶的规模化商业落地一直备受关注,一直是不少厂商关注的。距离自动驾驶规模化商业落地还有不少距离,尤其是在技术上存在一定挑战,现在最多的是单车智能技术一直在迭代更新,可要自动驾驶实现真正落地少不了路端、云端共同协同。
马斯克提到推出全自动的驾驶汽车,可能也有希望,最近人工智能技术多在大模型上体现出来,大模型的出现让人们看见人工智能的技术进步,特别是技术对的思维获取信息的能力有了很大的进步,之前自动驾驶多是依靠激光雷达技术获取信息,比如利用激光束来扫描周围环境,获取高精度的三维点云数据。这些数据可以用来构建车辆周围的环境模型,帮助车辆进行定位、避障和路径规划等任务,从而提高自动驾驶系统的性能。但是AI大模型的出现让人们看见了人工智能的人机交互技术。
现在也有厂商在汽车驾驶上尝试人工智能技术的应用,像五月份,百度Apollo汽车智能化业务就是以文心大模型为基础的新一代AI智舱。这是国内首个大模型在汽车行业应用的成果探索,更多的还是在语言上的应用。比如小度车载语音SDK基于大模型本地化,可以帮助提高座舱极致交互体验。可以做到流畅的免唤醒多路同时交互、全页面所见所说、全域毫秒级响应,让用户像是拥有了一个随时待命的私人助理。并且最大支持8路同时交互精确处理,覆盖整个座舱内外,能够做到多路同时、快速、连续对话的极限挑战。
基于文心大模型能力,百度Apollo针对车载场景进行专项训练和模型精调,无需人工数据标注,AI便会具备更出色的语言理解和学习能力。
人工智能用到汽车领域主要分为感知、模型或思考、执行三个部分,现在人工智能在自然语言理解技术上有所突破,就像百度的Apollo。还没能够做到完全在大的时间尺度上帮助汽车在感知和模型上应用,在小的时间尺度上比如汽车的控制方面的真正使用也还很早。
可以预见的是在AI大模型技术的加持下,之后基于大模型技术的智舱应该会有更多场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,同时应该也会在真正的道路识别自动驾驶上有更多帮助,更多的体现在和人之间的交互能力。
语言大模型为何增长放缓?
最近自然语言大模型现在增长有些遇冷了,有家网络分析公司Similarweb披露了相关数据,数据来看,今年前5个月,ChatGPT全球访问量环比增幅分别为131.6%、62.5%、55.8%、12.6%、2.8%,增长幅度明显下降;6月份ChatGPT的访问量环比下滑9.7%,为其推出以来首次。除访问量以外,用户使用ChatGPT的时长也在下降。
所以如果只是语言大模型把它当成一个聊天的工具、简单的获取知识的软件,随着热度的下降,随着落地应用速度的减缓,这期间可能很快就没有什么让大众有耐心等待技术深入语言类向下挖的市场了,更多的在等待大模型在应用端、在产业端、在垂直端上有一些研究出现。或许未来大模型已经不是简单的以为只是在图文界面图形生成、视频生成、自然语言对话方面有很大突破,更多的关注如何在应用领域里落地。
等到大模型发展到一定阶段的时候,可能更重视垂直类型的大模型,因为通用大模型基本上属于基于广泛的公开文献与网络信息来训练的,网上的信息可能有错误,或许一些专业知识与行业数据积累不足,数据基础没那么厚实,可能出现一些模型的深度和精准度没那么多的情况。可一些行业或者企业,客户对企业提供的专业服务要求越来越高,需要所提供的业务也越来越深。就到推企业研究有深度的垂直型大模型。
客户喜欢使用有深度有精准度的专业大模型,而且企业的数据也要保证做训练或精调。客户希望企业提供的大模型能够在实际应用里真正解决了某个问题,不是在众多的落地应用里处理部分问题。
像学而思宣布正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构;5月6日,淘云科技宣布推出儿童认知大模型——阿尔法蛋儿童认知大模型,为孩子在练表达、塑情商、启创造、助学习等方面带来全新交互体验。
再比如生物大模型能够提高AI制药效率。有相关研究报告显示,AI技术可以将新药研发的成功率提高16.7%,辅助药物研发每年能节约540亿美元的研发费用,并在研发主要环节节约40%至60%的时间成本。根据英伟达公开资料,使用AI技术可使药物早期发现所需时间缩短至三分之一,成本节省至两百分之一。
垂直领域中还有更大的期待——汽车
垂直领域当中应用当中还有更大的期待,比如汽车。汽车具有交互主体多、交互方式多、交互粘性强、计算零件多、数据规模大、空间属性等特点,这些特点决定了新汽车是大模型最大的交互应用场景。大模型的应用,也会给汽车带来涵盖情感化的数字人交互、开放而丰富的服务生态、智能生成内容与表现形式等在内的全新体验。
自动驾驶智能驾驶的本质属性即通过装置来替代人的操作,从这个角度看,人工智能是汽车实现更高级别智能化发展的必备的专业技术。
只不过目前AI技术在汽车上多是聚焦这两种的落地使用,比如用于人工智能交流对话领域,多数应用在智能座舱,像我们上面说的百度的文言一心,已有东风日产、红旗、长城等近十家车企宣布接入。还有就是商汤科技的日日新Sensenova大模型,也是具备中文语言模型“商量SenseChat”以及“如影SenseAvatar”等与座舱的结合。在之前的阿里巴巴也宣布AliOS智能汽车操作系统已接入通义千问大模型进行测试等。第二种应用多是聚焦智能驾驶,自动驾驶是人工智能的典型应用场景,人工智能赋予智能汽车超级大脑,超级大脑来提高更多的交互功能,像毫末智行发布了自动驾驶生成式大模型DriveGPT,帮助解决认知决策问题,最终实现端到端的自动驾驶。还有元戎启行打造了DeepRoute-Driver 3.0方案,优势是可不必搭载高精度地图,现在高阶智能驾驶产品D-PRO已获得车企定点合作,已经在深圳进行泛化测试。
汽车走向智能化时代,很多厂商都在关注智能化的几个方向,重点在智能座舱、智能驾驶、智能网联等领域,但智能驾驶难度远远高于智能座舱,这部分的投资是最高的。
但也要看清楚,现在还很早,很多都在研发与测试阶段,到底什么时候能落地还不知道,因为真正的模型数据调动管理少不了强大的智能网联汽车以及计算技术平台、云控技术平台等平台,只有大量的数据汇聚才可做交叉,特别是在智能驾驶这类垂直领域。
吕长顺(凯恩斯) 证书编号:A0150619070003。【以上内容仅代表个人观点,不构成买卖依据,股市有风险,投资需谨慎】