2022年AI模型一夜爆红整个AI圈,这是怎么做到的?
发表时间:2023-09-21 18:01:31
文章来源:炫佑科技
浏览次数:206
菏泽炫佑科技
2022年AI模型一夜爆红整个AI圈,这是怎么做到的?
2022年11月底,对话式AI模型悄然上线。 谁也没想到的是,这个模型一夜之间火遍了整个AI圈,所到之处都引起了热议。 很多人形容它是真正的“六角战士”:不仅可以用来聊天、搜索、翻译,还可以用来写故事、代码、调试……
上线仅两个月,月活跃用户就突破1亿,成为史上增长*快的消费类应用。 相比之下,根据 Tower 的数据,花了 9 个月零 2 年半的时间。 瑞银分析师感叹,“在互联网发展的20年里,我们找不到任何一个消费级互联网应用的用户增长速度更快。”
CEO黄仁勋对AI给予了非常高的评价。 他表示,AI是人工智能领域的一个时刻,也是计算史上*伟大的技术之一。
疯狂的高潮已经搅动了整个人工智能行业。 各大科技公司、机构、甚至个人都加紧了产品的研发。 然而,制作具有类似功能的模型哪有那么容易呢? 在参数数量方面,有一个共同的假设,即参数数量与GPT-3论文中引入的1750亿参数模型相同; 在训练资源方面,经过微软专门打造的AI计算系统训练总算力消耗约为3640 PF-day; 在推理阶段,按照今年1月平均独立访客数1300万计算,对应的芯片需求为3万块以上 A100 GPU,初期投资成本约为8亿美元,仅电费每天花费 50,000 美元。 这么算来,想要复制成功还是不容易的。
不仅如此,人们提高AI性能的重要途径大多是“细化大模型”。 短短几年时间,AI模型的参数数量从*初的数亿扩大到数千亿甚至万亿。
虽然进入这一领域的玩家越来越多,但有资源的企业正在加紧研发,势必赶上这波浪潮,而没有技术基础的企业也准备发力。 不过,在此之前,我们不禁要问:做课需要什么样的大模型技术积累? 它将面临哪些挑战? 是否有必要跟进? 中文版会不会只是山寨版? 未来,它能否*好地赋能垂直行业,或者融入第三方应用,实现价值*大化?
为了搅动风波自动化软件开发,解除空虚,机器心将于2023年3月21日在北京燕莎中心凯宾斯基酒店举办“大模型技术大会”,为人们提供一个专业、严肃的交流平台业内,重点从研究、开发和实际应用三个角度,探讨大模型技术和中国版的未来。
届时,机器之心将邀请大模型领域知名学者、行业顶尖专家作为嘉宾,通过主题演讲、圆桌讨论、QA、现场产品等方式与观众进行深入交流经验和其他形式。
**批特邀嘉宾及演讲内容
(按姓氏排序)
演讲主题:简要分析
分享嘉宾:车万祥,哈尔滨工业大学计算学部教授、博士生导师
个人简介:车万祥,哈尔滨工业大学计算系部级教授/博士生导师,人工智能研究所副所长,国家级青年人才,龙江学者“青年学者”,斯坦福大学访问学者。 现任中国中文信息学会理事、计算语言学专业委员会副主任兼秘书长; 国际计算语言学协会(AACL)亚太分会执行委员会委员兼秘书长。 目前正在承担国家自然科学基金重点项目、2030“新一代人工智能”重大专项等多项科研项目。 《自然语言处理:基于预训练模型的方法》一书的作者。 荣获AAAI 2013年度*佳论文提名奖。 负责研发的语言技术平台(LTP)已授权给百度、腾讯、华为等公司付费使用。 2016年获黑龙江省科学技术进步奖一等奖(排名第2),2020年获黑龙江省青年科学技术奖。
报告摘要:去年12月1日,谷歌推出了新一代会话式人工智能工具——因其惊人的语言理解、生成和知识推理能力而引起了整个互联网的热烈讨论和关注。 此次成功的表演让人们看到了解决认知智能核心问题——自然语言处理的可能路径2022年AI模型一夜爆红整个AI圈,这是怎么做到的?,被认为是朝着通用人工智能目标迈出了坚实的一步,这将对诸如搜索引擎。 ,甚至会取代很多人的工作,会颠覆很多领域和行业。 那么,解决了哪些科学问题,是如何解决的,未来还有哪些问题需要解决? 我们希望通过这份报告的粗略分析,能够部分回答上述问题。
演讲主题:《白泽》——数字发现的跨模态基础模型探索
分享嘉宾:李兵,中国科学院自动化研究所模式识别国家重点实验室研究员
个人简介: 李兵博士,人民科学院创始人,中国科学院自动化研究所模式识别国家重点实验室研究员、博士生导师,全国杰出青年、北京市杰出青年、“青年学子”中科院“典范”、科技部“新一代人工智能”。 重大项目负责人、国家自然科学基金重点项目负责人。 长期从事人工智能、跨模态内容理解和安全方面的研究。 在IEEE TPAMI等人工智能国际权威期刊和会议上发表论文100余篇。 曾获国家自然科学奖二等奖、中国自动化学会技术发明一等奖。 奖品。
报告摘要:随着GPT技术的快速发展,尤其是其突出的智能能力,传统的AI研究范式已经被打破。 同时,面对未来Web3.0环境下的海量多源异构泛视频数据,传统的单模态内容理解已经不能满足高语义级别的内容理解和线索发现的需求。 本报告首先探讨了以微博为代表的基础大模型带来的技术思考; 其次介绍了人民科技自主研发的跨模态基础模型百泽的技术特点; *后分享了“白泽”在数字世界发现领域的作用。 一些应用案例。
演讲主题:AI大模型与软件开发自动化
分享嘉宾:李革,北京大学计算机学院终身教授
个人简介: 李革,北京大学常任教授,博士生导师,教育部长江学者。 他的研究兴趣包括程序生成、程序理解、深度学习等,是国际上*早从事“基于深度学习的程序理解与生成”的研究者。 他的许多成果被国际学者认为是“初步成果”并被广泛引用。 迄今为止,其领导的研究团队在多项研究任务上均保持国际领先成果,是该领域国际知名的研究团队。 科研转化成果服务于航天领域重大项目、众多金融、IT领域大型企业以及数十万国际开发者。
演讲主题:多模态通用生成模型的重要启发
分享嘉宾:中国人民大学高瓴人工智能学院教授、博士生导师卢志武
个人简介: 卢志武2005年毕业于北京大学数学科学学院信息科学系,获理学硕士学位; 2011年毕业于香港城市大学计算机系,获博士学位。 主要研究方向为机器学习和计算机视觉。 设计了中国通用多模态预训练模型文澜BriVL并发表于。指导学生获得2021年度CCF优秀奖学金、2021年度百度奖学金。
报告摘要:多模态预训练近三年发展迅速,涌现出CLIP、CLIP等优秀模型。 受启发,多模态预训练出现了新的变化,多模态通用生成受到更多关注。 本报告将详细介绍多模态通用生成模型的*新进展,以及我们在这方面的思考和实践。
圆桌嘉宾:华为算法应用部部长王云鹤
个人简介:王云鹤,华为算法应用部总监。 在华为诺亚方舟实验室从事人工智能算法研发及其在实际业务中的应用。 主要研究领域包括计算机视觉、机器学习、模型压缩、高能效AI计算等,多项算法已落地工业化产品,领先的加性神经网络项目受到业界广泛关注。 发表相关领域CCF A级学术论文80余篇,包括ICML、CVPR、ICCV、IEEE TPAMI等。曾担任ICML Area Chair、VALSE Area Chair。
演讲主题:昆仑核心语言模型优化与部署实践
分享嘉宾:昆仑芯科技研发总监 王志鹏
个人简介:王志鹏,现任昆仑核心技术研发总监,电子科技大学硕士学位,原百度高级架构师,拥有十余年互联网产品技术研发及管理经验,在云计算和AI芯片行业拥有多年规划、研发和实施经验。 。 曾主导研发百度云基础IAAS技术体系,支持并拓展至数万用户; 近年来,全面负责国内互联网*大规模的自研AI芯片“昆仑酷睿1”和“昆仑酷睿2”的部署。 研发工作涵盖搜索、广告、推荐、CV、AIGC、GPT大模型等人工智能所有关键领域,并拥有多项与工作相关的技术专利。
演讲主题: —— 国内开源大模型
分享嘉宾:元宇智能创始人兼CEO徐亮
个人简介:徐亮,杭州元语智能(元语AI)创始人,权威中文自然语言理解评测基准CLUE创始人兼总裁。 多个热门中文版预训练模型(//)作者,多个大型中文数据集(///)作者,开源项目Star 30000+,连续创业者,AI+RPA厂商原创算法合作伙伴。 杭州远宇智能()是一家基于自主研发的本土化大型模型的产品平台公司。 致力于通用和工业AI大规模模型的产品技术研发和开源开发者生态建设。 2022年12月底,百亿参数的功能对话模型发布,近十亿参数的中国模型开源。 该模型的下载量已超过10万次。 目前,元语AI的大模型已覆盖金融、知识教育、零售、医疗等多个行业。
演讲主题::通用人工智能AGI之路
分享嘉宾:IDEA研究院首席科学家张家兴
个人简介: 张家兴,IDEA研究院首席科学家,北京大学博士,清华大学、香港中文大学、香港科技大学等兼职/实践教授,曾任研究员微软亚洲研究院、蚂蚁集团高级算法专家、360数字首席科学家/副总裁。 他带领团队创建了中文*大的开源预训练模型系统“封神榜”、**个开源的中文模型太乙,目前正在构建中国通用人工智能模型。