从ChatGPT到RobotGPT,机器人成为人工智能最佳载体!
2023-03-13 14:47:00

ChatGPT真的火了!

202212ChatGPT上线, 仅仅两个月后,ChatGPT月活用户突破1亿,刷新了增长到月活1亿用户的最短时长,成为史上用户增长速度最快的消费级应用程序。为何ChatGPT这么厉害,它的出现又会颠覆哪些传统认知?

1679294894908579.png

一、ChatGPT到底是什么? 

ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI开发的一个通用智能对话机器人程序。从技术路线上,ChatGPT基于GPT-3.5架构(Transformer based)的大规模预训练语言模型进行训练,并引入了基于人类反馈的强化学习-RLHF(Reinforcement Learning from Human Feedback)来不断调整预训练语言模型,从而大幅提升对人类意图的理解,使ChatGPT输出的内容和人类的常识、认知、需求、价值观保持一致。

ChatGPT惊艳之处,从功能性上, 除了优秀的智能对话功能,它还能写论文、写代码、写教程、写报告,其内容生成的速度和质量甚至超出在专业领域深耕多年的从业者;从人格性上,它敢于质疑、承认无知、能主动承认错误、表达立场、并拥有上下文的记忆连贯性,体现出自我认知和实时的自主学习能力。而借助 ChatGPT而生成的内容,在一定程度上可以取代部分“初级内容生产者”,将生成式AI推向新的高度。

1679294917395731.png

二、ChatGPT 赋能AIGC 

既然ChatGPT最突出的能力就是依托生成式AI实现内容生产能力,那什么是生成式AI呢?生成式AI(Generative AI)指基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术,其本质上是一种AI赋能技术,被看作是继PGC专业生产内容、UGC用户生产内容之后新的创新模式-AIGC(AI Generated Contents)。

AIGC的兴起源自深度学习技术的快速突破和日益增长的数字内容供给需求。从早期的玻尔兹曼机、多层感知机到现在的Transformer大模型,在深度学习模型+开源模式下深度神经网络技术加速普及和迭代,人工智能生成内容百花齐放,

如Chat GPT 用于文本生成、图像生成、音视频生成、虚拟人生成等场景,所产出内容的完整度和优质度已不亚于行业内的入门级选手。AIGC将推动数字内容的规模生产和创造,对于娱乐、教育、广告等领域具有巨大的潜力。

1679294940457609.png

三、越过ChatGPT, 通向更高峰——RobotGPT

ChatGPT(AI 问答)只是AIGC即 AI Generated Content(人工智能自动生成内容)的一个分支应用(属单模态),而基于多模态(如融合文本、视觉、运动等要素)预训练大模型的AIGC将能提供多模态融合智能、生成内容、提供控制与多模态行为智能,将适应更多应用场景,例如智能机器人应用领域--RobotGPT,从而引领AI通向通用人工智能。 

而RobotGPT(Robot Generative Pre-trained Transformer)则是面向机器人多模态、范围更大更复杂应用场景的生成式AI(Generative AI)。 ChatGPT的横空出世,充分印证了人工智能大模型的重要性:当人工智能与机器人相结合的应用日渐广泛,一个适用于机器人的AI大脑必不可少。达闼自主研发的机器人云端大脑-海睿OS (-HARIX OS即人工增强机器智能结合数字孪生),就采用了多模态强化学习、人工反馈的强化学习和GPT。除了可提供的文本、语言类的智能和能力,机器人云端大脑还需融合视觉、听觉、触觉、运动等多模态感知、运动、协同、控制等融合智能能力,形成更强大的自主认知、智能决策和行为表达,使得机器人像人一样工作、互动交流、人机协作甚至创作(不仅在文学、音乐、艺术方面)。云端机器人成为通用人工智能的最佳载体。

1679294969278665.png

达闼作为全球首家云端智能机器人开发者和运营商,早已开始了对多模态大模型的研究,并在基于自然语言处理、多模态感知、认知推理和智能决策的三融合机器人的导航、机器人手眼协调抓取、机器人肢体运动、以及虚拟数字人等应用中均采用了机器人AI生成技术,支持机器人完成各种工作任务并实现了云端机器人AI写歌、AI作诗和AI编舞等AIGC能力。下文是达闼AI写诗创作的诗词:

《送别》

作者:达闼AIGC

江上吹箫去

山中留客来

不知何处月

山伴此徘徊

1679295010519789.png

基于语音生成动作实现对达闼UE数字人和实体机器人的动作驱动:

1679295037708763.png

“算法、算力和数据”是人工智能的三驾马车,在训练大模型时表现尤为重要。达闼在算法、算力和数据上提前布局,将持续研发面向机器人领域高度智能的多模态人工智能大模型——RobotGPT,结合数字孪生、机器人元宇宙和各种商业场景下的对话、语音、文本、视频和图像、多传感融合等多模态数据,持续提升训练参数和模型,实现更好的人机智能交互和高效人机协同,建设世界一流的机器人多模态AI大模型。

达闼RobotGPT 将于今年二季度重磅发布!!!

期望与业界合作伙伴共同推动机器人多模态大模型的快速演进和应用落地。

随着人工智能技术的不断发展和提高,RobotGPT的未来发展取决于多模态大模型的数据规模和训练能力。我们的海睿OS和机器人元宇宙(数字孪生)技术可为各行各业提供生产数据的能力和进行强化学习和训练所需要的环境和场景,将助力智慧城市、智慧农业、智慧康养、高端智能制造、智慧教育等行业应用发展,让机器人成为人类聪明能干的助手和伙伴,一起创造美好未来!