虾皮小说【m.xpxs.net】第一时间更新《重生高三:科技霸主归来》最新章节。
时间来到2014年。
未来智能科技,这家由林风一手缔造的AI巨头,已经凭借“智学星”、“趣拍/Tick Tock”、“灵犀客服”等爆款应用,以及在智慧城市、AI芯片(启明一号已开始内部规模化应用)等领域的惊人突破,成为了华夏乃至全球科技界最耀眼的存在。
公司的估值早已突破数十亿美金,在全球范围内拥有数千名员工(包括大量顶尖的AI人才),其一举一动,都足以引发行业的震动。
但林风的目光,从未停止眺望更远的未来。
他知道,应用层的成功固然重要,但真正决定未来AI时代话语权的,是更底层的、能够理解和生成人类语言、掌握世界知识的**“通用人工智能”**雏形——大型语言模型(Large Language Model, LLM)!
在当时的世界上,美国的OpenAI(由科技狂人伊隆·马斯克等人创立,此时已发布GPT-2并开始展现潜力)和谷歌大脑,在LLM领域的研究处于领先地位,隐隐有垄断下一代AI核心技术的趋势。
“我们未来智能,绝不能在LLM这个主战场上缺席!更不能让华夏在这一关键领域受制于人!”林风在一次最高级别的AI战略会议上,对陈薇博士、周明博士等核心科学家说道,“我们不仅要做,还要做就做世界一流!做出真正懂中文、懂华夏文化的、我们自己的超大规模预训练语言模型!”
目标:打造华夏第一个世界级大语言模型!
这个任务,被林风列为公司未来三年内,优先级最高的战略项目,代号——“风”!
取“风起于青萍之末”,亦取“大风起兮云飞扬”之意!
项目由林风亲自挂帅,陈薇博士(机器学习)和周明博士(自然语言处理)领衔,调集了AI研究院最核心的数百名科学家和工程师,并获得了未来智能科技“未来一号”、“女娲”全球数据中心,尤其是搭载了数万颗“启明一号”AI芯片的超级计算集群的全力支持!
这是一场真正的、不计成本的AI“核武器”研发竞赛!
团队首先利用AI系统提供的“未来视野”,以及林风的指导,确定了比当时GPT-2更先进、甚至借鉴了部分GPT-3(对当时来说是未来)设计理念的Transformer模型架构。
接着,是数据的准备。赵志强的数据中心团队火力全开,清洗、整理了高达数TB的高质量中文语料数据(包括互联网网页、 digitized 古籍、百科知识、新闻资讯、以及部分经过严格脱敏和授权的公司内部数据),构建了当时全球范围内规模最大、质量最高的中文训练数据集!
然后,就是最关键、也最“烧钱”的——模型训练!
未来智能科技那庞大的、由数万颗“启明一号”AI芯片组成的超级计算集群,开始为了“风AI”的诞生而日夜轰鸣!
经过长达一年多的、消耗了天文数字般的计算资源和电力(幸好有国家电网的合作和AI优化调度,成本可控)的艰苦训练……
终于,在2014年底!
“风AI”大语言模型,训练成功!
内部测试结果显示,“风AI”不仅在中文的理解、生成、翻译、问答、摘要等各项能力上,全面超越了当时所有已知的语言模型,达到了惊人的流畅度和准确性,表现出令人赞叹的“智能”!
更令人惊喜的是,在许多通用的英文NLP评测基准(Benchmark)上,“风AI”的表现,也完全不输于、甚至在部分指标上超越了同期最强的OpenAI GPT模型(假设此时GPT-3尚未发布或刚发布不久)!
“我们……成功了!”当看到最终的评测报告时,饶是陈薇、周明这些见惯了风浪的技术大牛,也激动得热泪盈眶!
这是属于华夏AI的里程碑!
2015年初春。
未来智能科技,在首都京城,国家会议中心,举办了一场吸引了全球目光的、空前盛大的新闻发布会!