3月6日,阿里巴巴(09988.hk)跳空高开,一度涨至7.47%,报139.6港元/股,较2月24日的高点140.9港元/股,仅有一线之隔。
阿里云官方公众号发文称,公司发布并开源全新的推理模型通义千问qwq-32b。通过大规模强化学习,千问qwq-32b在数学、代码及通用能力上实现质的飞跃,整体性能比肩deepseek-r1。
据阿里云介绍,在保持强劲性能的同时,千问qwq-32b还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。此次,阿里云采用宽松的apache2.0协议,将千问qwq-32b模型向全球开源,所有人都可免费下载及商用。
阿里云指出,千问qwq-32b性能比肩全球最强开源推理模型。
在一系列权威基准测试中,千问qwq-32b 模型表现异常出色,几乎完全超越了openai-o1-mini,比肩最强开源推理模型deepseek-r1:在测试数学能力的aime24评测集上,以及评估代码能力的livecodebench中,千问qwq-32b表现与deepseek-r1相当,远胜于o1-mini及相同尺寸的r1蒸馏模型;在由meta首席科学家杨立昆领衔的“最难llms评测榜”livebench、谷歌等提出的指令遵循能力ifeval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的bfcl测试中,千问qwq-32b的得分均超越了deepseek-r1。
据证券时报报道,业内人士分析,qwq-32b的成功表明,将强大的基础模型与大规模强化学习相结合,能够在较小的参数规模下实现卓越性能,这为未来通向通用人工智能提供了可行路径。
值得一提的是,据上海证券报报道,1月20日,deepseek-r1推理模型发布后火速出圈,实现了最快复现openai o1推理模型。业内预计,我国头部科技公司阿里巴巴、字节跳动等有望在1到2个月内跟上r1的创新成果。
1月29日,阿里发布通义千问qwen2.5-max大模型。在多个基准测试中,qwen2.5-max比肩claude-3.5-sonnet,并几乎全面超越了gpt-4o、deepseek-v3及llama-3.1-405b。
2月25日,通义千问官方账号qwen在海外社交平台发布了qwq-max-preview(推理模型预览版),即将发布qwq-max正式版本、可部署在本地的较小版本以及官方app qwq-max。
据了解,阿里通义团队一直坚持开源路线。从2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问qwen及视觉生成模型万相wan等两大基模系列,开源囊括文本生成模型、视觉理解和生成模型、语音理解和生成模型、文生图及视频模型等,覆盖从0.5b到110b等参数,实现了全模态、全尺寸大模型的开源。
长江证券研报指出,近期,阿里在ai 领域持续发力,践行了其ai 驱动战略,随着其后续投入的逐步提升,相关成果有望加速迭代,相关成果或将惠及相关产业链,加速ai应用落地,进而进一步带动算力需求的爆发。同时,随着阿里在ai 基础设施、基础模型平台及ai原生应用、现有业务的ai转型等三方面加大投入,或将引领中国ai 产业加速发展。
本文综合阿里云微信公众号、证券时报、上海证券报、公开信息
(声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)
东南亚腹肌帅哥被绑起来简介 | 2天前 |
性瘾日记(高h 纯肉 np) |
冷月的网名大全 | 1天前 |
爆乳女仆狩猎完全版 |
筋肉雄汁furry龙搅基污图 | 9天前 |
天然素人面接无码av |
人与嘼xx漫画 | 7天前 |
餐桌下引诱公h芷珊最新章节 |
uralesbian官方网站 | 1天前 |
伊莉雅本子h调教全彩 |
www.17c.com一直草 | 2天前 |
龙珠18号h同人漫 |
斗破调教美杜莎成性奴 | 0天前 |
?少妇?自慰喷水www |
高撅红肿h羞耻罚老师受学生攻 | 8天前 |
泳装女沙滩泳装 |
国产三级农村妇女在线播放 | 0天前 |
熟睡被迷奷呻吟 |
国产91❤在线播放九色竹菊 | 0天前 |
老头恋老汉同性gay |