来源 |AI 蓝媒汇
【资料图】
ID:lanmeih001
作者 | 伊柒
编辑 | 魏晓
" 每隔一段时间,就会有一个革命性的产品出现,然后改变一切。"
这是 2007 年 1 月 9 日,乔布斯在一次手机发布会上的开场白。手机名叫 iPhone,它改变了通讯、娱乐和移动互联网。之后,iPhone 或是和 iPhone 类似的手机,出现每个人的手中。
2022 年 11 月 30 日,由 OpenAI 研发的 ChatGPT 问世。
在最初的描述中,ChatGPT 被称为 " 聊天机器人程序 ",但人们发现这个 AI 能做的不只是 "Chat" ——之后的几个月,人们陆陆续续将它接入各种场景:答疑、编程、绘画、翻译、文本创作、广告设计、头脑风暴……然后震惊于 AIGC 的想象力、创造力和生产效率。从聊天到创作,或许在 2023 年之后,没有任何一个行业有理由完全排除 AIGC。
此时此刻,恰如彼时彼刻。
但也有不同——这一次,国内 AI 行业的跟进远比过去及时。百度、商汤等几位 AI 课代表很快推出了类似 ChatGPT 国产 AI 大模型,外界的质疑声中渐渐听到了掌声。
2023 年 4 月,昆仑万维「天工」3.5 大语言模型发布,并启动邀请测试。AI 蓝媒汇(ID:lanmeih001)的蓝媒君第一时间对话了「天工」大模型。
对话的内容,都和 " 理想 " 有关:AI 大模型没说自己的理想,但它鼓励蓝媒君坚持理想—— " 记得不要因为挫伤自尊心而放弃。"
昆仑万维的理想—— " 目前版本我们对标的主要是 OpenAI 的 ChatGPT。未来让它尽快达到 GPT4 的能力。"
国产 ChatGPT,能再迎一次惊喜吗?
第一个实现 " 智能涌现 " 的国产大模型
在和「天工」大模型的对话中,蓝媒君预设了一个场景:中学老师与学生对话,目的是确定学生的兴趣。
对话过程如下。
蓝媒君确实曾和体育场里面的小朋友聊过这个问题,当时小朋友的回答是 " 喜欢跑步 "、" 觉得好玩 "。尽管在一开始就预设了问答模式,但「天工」大模型在实际对话中并没有完全遵循 " 每答必问 " 的结构——或许是算法判定蓝媒君 " 喜欢踢足球 " 这个话题已经讨论充分,可以作为 " 你的兴趣是什么 " 的答案。蓝媒君提出了第二个兴趣,看书。
从这里可以看出,「天工」大模型依然延续着刚才关于 " 确定兴趣 " 的这个话题,并遵循了问答结构。对话继续,蓝媒君的爱好很多。
「天工」大模型所给出的反馈始终直白,像是两位小朋友最日常的对话:你喜欢科学,那你会怎么做?以上文本在成年人看来略显简单,但一问一答确实符合需求——「天工」的回答做到了逻辑通顺、推进沟通。而这种简单通顺,或许正是人们需要的。
或许整场对话难言十分惊喜,但至少从对话逻辑和内容上,「天工」基本做到了连贯通顺、符合人类逻辑。在谈到大模型的逻辑推理时,昆仑万维称,「天工」目前的记忆力大约可支持 20 轮次以上的交互式问答,文本容量也在万字以上。
" 在 AI 领域,进行自主学习并完成逻辑推理等任务的能力,被称为‘涌现’能力。" 而根据昆仑万维 CEO 方汉的介绍,「天工」大模型是目前 " 国内第一个实现智能涌现 " 的国产大语言模型。
这是一个在相对简单的系统中,由量变产生质变,最终产生复杂的行为或特性的过程。
而根据官方提供的测试数据,基于千亿基座模型和千亿排序模型,「天工」大模型生成内容已经能够在某知识社区的问答中,获得 KOL 级的赞同和回应。
但「天工」偶尔也有失误的时候。
在另一份关于数学题的测试中,天宫大模型准确算出了一道鸡兔同笼题目,但却被另一道来自中学数学课本的一元一次方程困住,并最终得出了一个错误的计算结果。
或许是对题干的理解偏差,或许是方程组相关的数据训练还不够完善,「天工」在运算方面的能力和方法,仍有些改进空间。谈及大模型训练的工程进度,昆仑万维方面表示,关于数据的筛选、剪枝和清洗是 " 长期主义 " 的过程——「天工」大模型将在后续的迭代中,通过筛选数据调整参数改进模型设计。
" 问题会有,但正视差距不会影响团队的信心。"
而「天工」大模型,也只是昆仑万维在 AIGC 赛道内的落脚点之一。
合作破局
和大模型同期公布的,还有昆仑万维同阿里云的 AI 合作项目。
4 月 11 日的阿里云峰会上,昆仑万维与阿里云共同发布了包括智算中心建设、大模型训练等领域战略合作。
这并非是两家公司首度牵线—— 2015 年到 2020 年间,昆仑游戏、闲徕互娱,OPay 海外支付业务已经相继接入了阿里云业务。
两家公司在 AI 领域的合作则稍晚一些。2021 年,昆仑万维开始规划自建大语言模型之后,于 2022 年 2 月敲定第一批 AI 算力集群的项目合作。
项目的合作方,正是阿里云:" 当时合作主要是依托阿里那边的高性能 AI 计算集群,进行大规模语言模型预训练工作。"训练内容囊括了算法与架构的协同、计算流水线与架构的协同、最优化存储、TCO 优化四个方面。
双方此番合作,目标是则是要进一步盘活国内 AIGC 生态——不只是大厂背书,还有技术合作。
昆仑万维方面表示,随着「天工」训练规模的扩大,模型参数逐渐接近万亿规模," 单个训练任务需要 5000 张以上 A100(GPU 芯片),这样大规模的 GPU 集群下,通信会产生大量的拥塞,训练效率会越来越低,对存储读写性能同样是个挑战。"
而阿里云所提供的,则是业内最领先的算力平台。" 后续昆仑万维的 AIGC 业务,预计会有阿里云的灵骏底座 +PAI 软件平台加持。"
AI 蓝媒汇曾在一文中提及,国内 AIGC 项目始终绕不开算力和成本的阻力,昆仑万维 CEO 方汉也表示,在目前的大模型训练中,购买或者租赁英伟达的 A100 系列 GPU 仍占据了不少开销。
"资源是一张门票。大模型训练的门槛就是几千张 GPU 芯片。而在芯片到齐之后,接下来还要拼工程经验——实验的速度,人才的厚度。"
围绕 ChatGPT 开展的 AIGC 项目,在变现之前仍需付出。
按照计划,在 2023 年的 6、7 月份,阿里云会为昆仑万维打造一个专属的、支持万卡扩展的 AI 算力集群。
" 我们期望与阿里云展开深入合作,激活国内 AIGC 技术生态,为中小企业和开发者的创新提供便利。我们一直觉得,当产品的能力足够好、真正能够帮助用户解决刚需,那么获得经济回报就是水到渠成的事。"
而现阶段昆仑万维的业务重心,则仍在研发和训练领域:" 潜下认真打磨产品,帮助模型进化到更高水平,让它尽快达到 GPT4 的能力。"
可以预见的是,在未来一段时间内,包括昆仑万维在内的国内 AI 玩家,仍将面对 GPU 资源量方面的阻力,仍将是赛道内的追赶者。
至于何时追近,能否比肩,AIGC 的从业者同样需要市场和时间来解答。
今日话题
你想和 AI 大模型聊什么?
来评论区我们聊聊 ~
标签:
中新网7月3日电国家卫健委3日下午举行新闻发布会。会上,国家卫生健康
每日小编都会为大家带来一些知识类的文章,那么今天小编为大家带来的是
原定今日14点开票的LPL先下观赛门票推迟开票,目前购票页面只有7月3日
6月30日,“好品山东澳柯玛惠享青岛家电节”启动暨青岛地铁澳柯玛主...
特斯拉7月2日公布了第二季度汽车产量和交付量数据,今年第二季度,特斯
苹果手机14屏幕一直亮着,可能是由于多种原因造成的,我们需要逐一排查
怀孕期间吃什么对胎儿发育好,怀孕期间这个很多人还不知道,现在让我们
1、如新spa机,1和2做脸蓝白胶,3是那支舒纹精华露,4是身体蓝胶,5国
达利欧:为什么世界正处于大混乱的边缘?来源:华尔街见闻近期,桥水基
原标题:12年等待,今朝梦圆——记中国女篮重夺亚洲杯冠军新华社北...
大家好,我是小编。作为一名宠物主人,我们都希望我们的狗狗能够友好地
据微信公众号“内蒙古自治区住房资金中心”消息,为进一步满足广大...
海南日报讯(记者易宗平)逐梦青春,“就”在海南。省人力资源开发...
天津北方网讯:连日来,以农民心向党为主题的农民画创作展示活动,在北
天人互泰:据于易理、源于哲理、循于公理、合于义理。——摘自《天...
面经1-消息队列如何保证可靠性-消息队列如何保证消息幂等性-消息队列
快科技7月3日消息,在日前举行的AITO问界M5智驾版用户编程客栈体验日上
1、可以试一下飞行模式重置法。2、试一试还原网络设置的方法。3、试着
5G规模应用还需迈过几道坎
每经AI快讯,7月2日,券商给予评级的个股数共有28只,获得买入评级的个
1、即以每隔一定时期投入一定额度的资金为投资方式的基金类型。2、分为
一、广西壮族自治区崇左市天气预报1、扶绥县气象台23日1时29分发布雷电
游戏中有各种各样的策略你需要知道。只有知道了策略,才能快速取得游戏
在上半年的最后两天,AIGC又给风投圈创下了新的“神话”。6月29日,...
当地时间7月2日,据当地警方消息,柬埔寨金边7月1日下午一娱乐场所发生
7月2日下午,山东泰山队在基地内进行了与上海海港队的赛前官方训练。本
记者获悉,上海美术学院造型艺术相关专业毕业生的20余件优秀作品将于7
1、开始=>运行=>regdit HKEY_LOCAL_MACHINE=>SOFTWARE=>EAGames=>Ba
备受瞩目的中国男篮出战世界杯的比赛还没有开打,关于中国男篮最强核心
【上海推出今年第六批次集中供应楼盘备案均价66617元 平方米】从上海市