首页

贞锁女王

时间:2024-05-08 02:09:22 作者:微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争 浏览量:61323

  科技巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。

  当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷歌的Gemini 1.5、Anthropic的Claude 3和OpenAI的GPT-4等知名大模型相匹敌。微软或将在5月21日开始举办的Build开发者大会上演示这款新模型。

  据报道,MAI-1的开发由前谷歌AI领导人、曾担任AI初创公司Inflection首席执行官的穆斯塔法·苏莱曼(Mustafa Suleyman)领导。就在今年3月,刚刚领投完Infection的最新一轮融资,微软便从Infection挖走了包括苏莱曼在内的两位联合创始人以及部分员工。有知情人士透露,微软为此向Infection支付了超过6.5亿美元。

  尽管MAI-1可能借鉴了Inflection旗下模型的部分技术,有微软员工表示,MAI-1是一款全新的大语言模型,拥有约5000亿个参数,远超微软此前训练的任何开源模型。不到一个月前,微软刚推出了一款名为Phi-3的小型AI模型,其中Phi-3 mini被优化至可部署在手机上,拥有38亿参数,经过3.3万亿token的训练,微软称其性能与GPT-3.5等模型相当。

  相比之下,MAI-1的规模要大得多,也需要更多的算力投入和训练数据。为了训练该模型,微软已经配置了大量包含英伟达GPU的服务器集群,并从各类来源收集训练数据,包括由OpenAI的GPT-4生成的文本和公共互联网数据。这或将使MAI-1与OpenAI的GPT-4处于相似的水平,据传后者拥有超过1万亿个参数。

  Phi系列模型和MAI-1的研发体现出微软或在AI领域采取了双重策略,一边为移动设备开发小型本地模型,一边开发由云端支持的更大规模的模型。不过,即使在微软内部,MAI-1的确切用途也尚未得到确认。

  更重要的是,MAI-1体现出微软并不希望在AI领域完全依附于合作伙伴OpenAI的技术。来自OpenAI的技术正在驱动微软的各类生成式AI功能,包括集成在Windows中的聊天机器人。此前,有来自微软AI平台团队的员工抱怨称,公司的AI战略过于关注与OpenAI的合作关系,使得微软对AI原创研究的预算减少。

  6日当天,微软首席技术官凯文·斯科特(Kevin Scott)在领英上发帖,间接回应了关于MAI-1的报道。他表示,OpenAI使用微软构建的超级计算机来训练AI模型,而微软的研究部门和产品团队也在构建AI模型:“AI模型几乎出现在我们的每一项产品、服务和运营流程中,制作和运营它们的团队有时需要做一些自定义工作,无论是从头开始训练一个模型,还是微调别人构建的模型。未来将会有更多这样的情况,其中一些模型的名字包括图灵(Turing)和MAI。”

  为了实现在AI方面的突破,微软也在大力囤积算力资源。4月初,有报道称微软计划到今年年底前囤积180万块AI芯片,意味着公司希望在2024年内将所持有的GPU数量增加两倍。据知情人士透露,从2024财年到2027财年(到2027年6月30日结束),微软预计将在GPU和数据中心上花费约1000亿美元。

  澎湃新闻记者 胡含嫣

展开全文
相关文章
2024年晋阳海关已签发10份“萌宠护照”

山东省政协常委、社会法制委员会副主任,北京金诚同达(济南)律师事务所合伙人会议主任王玉亮在大会发言中表示,有针对性地开发社区消费和生活服务,建立起“小社区,大消费”的经济生产新模式,对于扩大有效需求、拉动经济增长具有重要意义。他建议,以更强的“智慧”加速社区消费升级。鼓励利用物联网、云计算、大数据、人工智能等技术,推动商品、门店及供应链数字化转型,提升服务质量和管理效率。依托AR、VR等前沿技术,融入文化创意、光影技术、IP等元素,打造智慧街区。

国防部:根本不存在所谓的“海峡中线”

此次专业增设、撤销、调整共涉及3389个专业布点,数量之多为历年之最。其中,新增布点1673个、撤销布点1670个,数量基本持平。以学科门类计,工学所涉专业数量最多,有1322个,占比39%,这与工学作为第一大学科门类的基本情况相呼应。从区域布局看,涉及中西部高校的专业有1802个,占比53.17%。普通高校本科专业结构和区域布局进一步优化,高校在专业设置上更趋理性。

住建部:加快谋划第二批及后续保障性住房项目

杭州亚运会开幕式在菲引起巨大反响,各大媒体争相报道。《菲律宾星报》用“高科技”“令人惊叹”来形容杭州亚运会开幕式盛景,认为在“巨型莲花”体育场举行的本届开幕式是“历史上对增强现实技术(AR技术)最丰富、最熟练的运用”,中国组织者使用数字烟花而不是传统烟花,将有效推动全世界关注此类盛会的“环境可持续和AR技术的未来”。文章称,开幕式中未来派表演与传统文化表演完美结合,令人“眼花缭乱”,不仅展示了杭州这座美丽城市的无穷魅力,也展示了中国作为世界第二大且仍在不断增长的经济体的“史诗般”社会经济转型成果。

新疆霍尔果斯口岸前2月进出口货运量逾690万吨

根据财政部公告,2024年第一期、第二期储蓄国债(凭证式)于3月10日至3月19日发行。两期国债均为固定利率、固定期限品种。其中,第一期期限为3年,最大发行额150亿元,票面年利率2.38%;第二期期限为5年,最大发行额150亿元,票面年利率2.5%。

辽宁省辽阳市委原书记唐志国被开除党籍

5630/5629次列车由中国铁路成都局集团有限公司重庆客运段担当,是目前川黔铁路上唯一的旅客列车,列车全程运行约300公里,历时7个多小时,沿途停靠21个车站,由于低廉的票价,一直以来都是沿线民众出行的重要交通工具。2022年7月,这趟“慢火车”升级为空调车,专设“带货车厢”,以便村民将农特产品带上车售卖。

相关资讯
热门资讯
链接文字