Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE_JDB(中国电子)官方网站

新闻资讯

023-62457490

联系人：张生
电话：023-62457490
传真：023-62457490
手机：18584563942
邮箱：admin@youweb.com
地址：重庆市南岸区南坪正街16号7层

立即咨询

当前位置： JDB电子 > 新闻资讯 > 公司动态

Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE

发布时间：2025-02-05 12:08:28 丨浏览次数：

　　五金2、无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni，支持图像、音频、文本理解

　　4、微软 CEO 纳德拉力挺 OpenAI：在人工智能竞赛中领先两年，几乎“没有竞争对手”

　　佳沃天河是一家高可靠智能农业机器人研发商，是佳沃集团创新生态产业布局高科技企业。公司聚焦智能机器人的技术创新和整体解决方案，自主研发了高可靠系列养殖机器人、智能高效环境净化系统和物联网云管理平台。已形成了养殖机器人、饲喂投料机器人、专用清理机器人、地沟夜视清粪机器人、智能消杀机器人及林果植保机器人等“智慧机器人”产品矩阵。

　　设序科技是一家工业AI生成式设计软件与方案供应商，致力于使用基于AIGE(Engineering) 数据结构的AI技术，提高工业设计、仿真、工艺及制造等环节的效率与质量。其核心竞争能力在于将AI技术融合入工业CAD设计的软件中，通过积累大量的工业数据、工业设计行业知识和深度学习算法能力，实现大幅提升工业设计、仿真、工艺规划和制造等设计生产环节的效率，将原有的数十小时级的设计工作量缩短至分钟级。旗下产品“闪设”是一款工业智能生成式设计软件，基于自研的AIGE（Engineering）数据结构，依托AI技术和几何图形技术提供云架构下的智能生成和智能交互功能赋能工业设计。

　　3、通用软体机器人研发商「万勋科技」完成2亿人民币A2轮融资，由为元钛基金领投，德虎资本跟投。

　　万勋科技是一家通用软体机器人研发商，公司首创通用软体机器人技术——Pliabot®柔韧技术，以软材料仿生肌肉和神经元智能复刻人类肌肉柔韧特性，对比传统机器人技术具有高适应性、高负重比、高环境抗性、安全互动和成本优势，为各类应用场景打造安全、灵巧、轻盈、强韧、可负担的机器人产品与解决方案。

　　4、Z世代职业成长服务平台提供商「极壤UNIMISSION」完成战略投资，投资方为科锐国际。

　　极壤UNIMISSION是一家Z世代职业成长服务平台提供商。公司专注于打造的“招测培育就”一体化智能平台，致力于精准解决眼下大学生就业和企业招聘的结构化矛盾。其平台通过智能AI的测试系统，从多个维度帮助年轻人找到属于自己的“职业天赋”，通过分析，快速形成以就业为目的、以“天赋”为目标的个性化成长方案；结合高频的课程、活动、人脉、实践等8个方面的锻炼，让广大学生群体在大学四年期间精准垂直强化自身的天赋能力，形成个人的“就业力”。

　　12 月 16 日消息，月之暗面 Kimi 今日发布视觉思考模型 k1。该模型基于强化学习技术打造，原生支持端到端图像理解和思维链技术，并将能力扩展到数学之外的更多基础科学领域。

Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE(图1)

　　月之暗面官方表示，在数学、物理、化学等基础科学学科的基准能力测试中，初代 k1 模型的表现超过了 OpenAI o1、GPT-4o 以及 Claude 3.5 Sonnet。

Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE(图2)

　　从月之暗面官方获悉，Kimi 新模型发布即上线视觉思考模型已陆续上线最新版「Kimi 智能助手」的 Android 和 iPhone 手机 App 以及网页版在最新版手机 App 或网页版 Kimi+ 页面找到「Kimi 视觉思考版」，即可拍照或传图体验。

　　「Kimi 视觉思考版」会完整呈现推理思维链 CoT，让用户不只看到答题结果，也能完整看到模型思索答案的全过程。

Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE(图3)

　　从模型训练的角度看，k1 视觉思考模型的训练分为两个阶段，先通过预训练得到基础模型，再在基础模型上进行强化学习后训练。k1 的基础模型重点优化了字符识别能力，在 OCRBench 上得到 903 分的（state-of-the-art）结果，在 MathVista-testmini、MMMU-val 和 DocVQA 基准测试集上分数分别为 69.1、66.7 和 96.9。

　　月之暗面表示，k1 的强化学习后训练在数据质量和学习效率方面做了进一步优化，在强化学习的规模化（scaling）上取得了新的突破。

　　此外，科学的模型能力基准测试方案是大模型行业面临的重要挑战之一。由于市面上缺乏针对基础科学学科的图形测试集，Kimi 模型研发团队自主构建了一个标准化的测试集 Science Vista，涵盖不同难度的数理化图片题目，且从分布上与实际用户需求较为匹配。该测试集将开放给全行业，用户可申请在许可范围内使用。

　　在内部测试中，月之暗面也发现了一些 k1 视觉思考模型存在的局限性，例如在分布外（out-of-distribution）的泛化、在更复杂问题上的成功率、在更多噪声场景的准确率、多轮问答效果等方面，有很大提升空间。在一些场景和泛化能力上，k1 模型与 OpenAI 的 o1 系列模型相比仍有差距。（IT之家）

　　2、无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni，支持图像、音频、文本理解

　　12 月 16 日消息，无问芯穹今日宣布，开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。

Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE(图4)

　　官方表示，Megrez-3B-Omni 是一个为端而生的全模态理解模型，同时具备图片、音频、文本三种模态数据的处理能力：

　　在语音理解方面，Megrez-3B-Omni 支持中文和英文的语音输入，还能够处理复杂的多轮对话场景，也能支持对输入图片或文字的语音提问，实现不同模态间的自由切换。

　　官方宣称，与上一代及其他端侧大语言模型相比，单模态版本的 Megrez-3B-Instruct 在推理速度上取得了显著提升，最大推理速度可以领先同精度模型 300%。（IT之家）

Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE(图5)

　　12 月 16 日消息，武汉大学人工智能学院今日揭牌成立，由中国科学院院士、武汉大学校长张平文教授担任首任院长。

Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE(图6)

　　学科建设和科学研究方面，武汉大学人工智能学院依托武汉大学优势学科和诸多重点研究机构的支撑，重点聚焦数理基础与数据科学、机器学习与智能科学、智能自然科学、智能社会科学等四大方面，力争在“AI + 理学”“AI + 工学”“AI + 医学”“AI + 人文社科”等前沿领域实现突破。

Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE(图7)

　　师资队伍建设方面，该学院设有人工智能理论系、人工智能应用系人工智能研究院和实验教学中心，未来将加大拔尖人才引育力度，进一步提升师资队伍水平。

　　人才培养方面，该学院将自 2025 年起在“人工智能”专业招收本科生，在“智能科学与技术”学科招收学术型硕士和博士研究生，在“电子信息”学科招收专业型硕士和博士研究生。

　　小米集团武汉区域总经理王扉发言称，热烈祝贺武汉大学人工智能学院的成立，他期待小米能与新学院建立更加紧密的合作关系，通过产教融合实现资源共享、优势互补，共同推进人工智能技术的研发与应用。

　　据IT之家此前报道，去年 11 月 29 日，武汉大学 1987 级计算机系校友，小米集团创始人、董事长兼首席执行官雷军向母校捐赠 13 亿元人民币。雷军表示，此次捐赠主要聚焦三个方向：支持数理化文史哲六大学科基础研究、支持计算机领域科技创新、支持大学生培养。

Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE(图8)

　　今年 3 月 11 日，武汉大学宣布在雷军基金会的提议和捐助下，联合小米成立机器人系，顺应数字时代潮流，推动产学研深度融合。

　　武汉大学 3 月 25 日宣布开设“雷军班”，该班在今年高考后向全国招 30 名本科生，配备最优师资力量，实行小班教学，本硕博自主定制，可 100% 具备保研资格，同时设立项目专项经费支持相关学生参加国外研修、游学以及国际国内学术会议。（IT之家）

　　12 月 16 日消息，据《商业内幕（Business Insider）》报道，微软首席执行官萨提亚・纳德拉最近表示，OpenAI 在人工智能领域拥有两年的领先优势，使其几乎“没有竞争对手”（pretty much uncontested）。

　　自 2019 年起，微软便开始投资 OpenAI，该公司在 2022 年 11 月推出 ChatGPT，引发了人工智能领域的军备竞赛，纳德拉认为，ChatGPT 的发布赋予了 OpenAI 一个“逃逸速度”，让包括谷歌在内的竞争对手陷入被指“措手不及”的境地。

　　注：“逃逸速度”指一个物体为了摆脱一个天体（如地球）的引力作用而需要的最小速度。当物体达到这个速度时，它将不再落回，而是飞向太空。

　　他还表示：“我认为以后很难再出现这种两年的领先。也许通过某种基础模型无法再建立这样的领先局面，但我们确实享有这个优势，而这就是 OpenAI 给我们带来的巨大优势。”

　　ChatGPT 发布后，微软迅速利用 2019 年对 OpenAI 的投资加深了与 OpenAI 的合作，开始将其技术整合到 Office 应用、Bing 搜索引擎和 Edge 浏览器中，抢先于主要竞争对手推出市场。作为回报，微软为 OpenAI 提供了强大的云计算资源。

　　微软是 OpenAI 的早期投资者，2019 年投入了 10 亿美元。根据最新的美国证券交易委员会（SEC）文件，微软总共向 OpenAI 投资了 130 亿美元。（IT之家）

　　曾于2018年成为国内资本热点的低代码（Low Code）赛道，当下正随着AIGC加速落地热度再起，被部分业内人士视作继AI搜索之后的又一大热门赛道。

　　据财联社记者观察，前有海外AI编程工具Cursor爆火被称为硅谷“码农”最爱，后有个人用户借助Cursor一小时写出APP拿下App Store付费榜第一。低代码的风也吹到了A股。近日，宝兰德（688058.SH）、开普云（688228.SH）、理工能科（002322.SZ）、金现代（300830.SZ）等上市公司争相通过互动易对外披露各自低代码布局，受到资金青睐。

　　财联社记者多方采访获悉，基于过去几年布局，低代码基本已进入白热化阶段，降本增效、信创等背景下，用户对于低代码的需求旺盛，当下或已步入工程级别，AI的加持则有效提升了其易用性，未来有望颠覆生产方式、重塑技术团队，不过现阶段大模型幻觉、落地成本高、数据安全性等问题仍待解。

　　“目前在做低代码垂直大模型的A股公司较少。我们做低代码平台很多年了，加上大模型能力也就是最近这两年。我们自己还是比较看好（低代码垂直大模型），现在是和智谱合作，之前也用过别的大模型。”近日财联社记者以投资者身份致电金现代证券部，公司人士如是称。

　　金现代近期对外披露，已基于智谱华章ChatGLM4大语言模型构建了低代码领域专有大模型。普元信息（688118.SH）亦看到了AI+低代码机会，公司人士向以投资者身份致电的财联社记者表示，公司低代码产品主要用于金融、能源、通信Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CEO 纳德拉力挺 OpenAI极新早报、先进制造等领域大中型客户，目前已接入外部大模型，同时公司亦在研发相关专有模型。

　　据财联社记者观察，低代码是一种可视化应用开发方法，用较少代码、以较快速度实现应用程序交付。多位受访者表示，AI低代码是生成式AI相对较快的一大落地应用方向。

　　今年8月，四名MIT本科生创立的Anysphere（今年11月估值已达25亿美元）推出的首款产品AI代码编辑器Cursor火出圈，被外媒称为“性自然语言编程助手”。近日一款名为小猫补光灯的软件拿下App Store付费榜第一，该软件正是由个人用户用一小时通过Cursor编写而成。

　　或受此消息影响，近期二级市场上低代码概念爆发，金现代、浩云科技（300448.SZ）、普元信息一度20CM涨停。据悉，低代码概念早在去年市场热炒ChatGPT概念应用时就曾多次出现异动。

　　而据公开资料，低代码的概念可追溯到1980年IBM的快速应用程序开发工具（RAD），2014年由研究咨询公司Forrester正式提出，海外Salesforce、AWS、Google、微软、Oracle等巨头此后纷纷入局。在国内，这一赛道也受多家大厂重视，目前已涌现出诸如腾讯微搭低代码、飞书低代码平台、钉钉宜搭、百度爱速搭、网易CodeWave等产品。

　　据悉，腾讯云云开发是腾讯云旗下的开发者工具，已经服务了超过300万小程序开发者，其产品形态包括云端一体化开发平台“微信云开发”和低代码工具“微搭”。近期，腾讯云云开发还推了AI辅助开发工具“云开发Copilot”，让开发者可以用自然语言直接生成和修改应用。

　　腾讯云云开发负责人在接受财联社记者采访时表示，“我们一直也在思考大模型可以怎么改变开发的体验。基于开发者的需求，目前我们有两个方向的探索：一是用云开发Copilot生成代码，部署即可用，直接构建出可运行的服务，包括低代码模式（生成应用后通过低码组件拖拉精调）和全代码模式（生成可以精调代码）。二是在小程序开发工具里接入一些大模型，方便开发者直接调用。”

　　甲子光年智库报告显示，AI代码平台领域参与者类型丰富，企业均希望依据自身技术或行业know-how迅速切入市场，通过先手占据更好的生态占位；并且越来越多的企业正在进行产品打磨与场景探索。

　　小猫补光灯的“出圈”是否可被视作AI生成代码走向成熟的一个标志？腾讯云云开发负责人称，“这类软件以前其实也能（通过低代码方式）做出来，大家并不会因为小猫补光灯的出现而说技术成熟，可能甚至有些人做的应用比这个还复杂。”

　　据财联社记者了解，从目前国内开发系统的占比看，小程序约占30%、企业内部管理系统占30%，剩余40%主要是较复杂的系统（如大规模后台服务），其中小程序、管理系统基本均可通过快速框架或工具得以开发，属于低代码开发优势较明显的领域。

　　前述腾讯云云开发负责人表示，客户的预算变化导致服务商要解决成本问题，直接带动了AI生成代码的需求高涨。他举例称：某服务商做定制系统，两年前年均人力成本约30-50万元，现在则降至10-20万。“软件服务成本，除了云服务成本、机器成本，最直接的就是开发的时间成本、人力成本。通过引入AI辅助开发的工具，可以有效地降低人力成本。”

　　“由于当前经济景气度下行，用户希望通过数字化手段推动企业进一步降本增效，低代码开发平台的价值进一步凸显。相比于前几年往往需要厂商对用户侧进行反复宣贯，现在有更多用户选择主动了解低代码开发平台的概念与能力，并主动推动项目立项。”IDC中国研究经理王彦翔告诉财联社记者，目前用户认知基本成熟。

　　值得关注的是，腾讯云云开发负责人将AI代码开发工具分为编程级别工具（如Cursor）和工程级别工具（如Bolt.new、v0）。

　　采访中，他特别强调了往前演进了一大步的工程级别工具：“最近几个月大家已经开始在社区里谈论工程级别AI代码开发，其在生产应用方面的可用性高很多。原来当成玩具一样去看（低代码工具），但是一到工程级别、生产级别，它就会发生很本质的变化。”

　　在他看来，AI代码开发工具除了快速，还要解决定制化的问题，始终要面向生产应用，不应只是To C，“微软、谷歌等大厂基本也是这一思路。”

　　Google CEO Pichai在第三季度财报电话会议中特别提到，Google内部超过25%的新代码由AI生成，AI时代是否人人都是程序员的话题受到诸多讨论。据财联社记者了解，AI的加持能有效提升开发平台易用性，于技术团队而言或是一次重塑，不过开发始终存在一定技术门槛，技术“小白”很难做到完全上手。

　　财联社记者查阅社交媒体获悉，小猫补光灯APP开发者严格来讲并非完全零基础（前互联网公司产品运营从业者、曾自学Python）。王彦翔则认为，零基础的开发者到可以熟练使用低代码开发平台周期基本在一个月左右。

　　而回顾AIGC浪潮来临前的传统低代码，一位法律科技产品经理告诉财联社记者。“低代码前几年是挺火的，但是由于需求变化多，代码修改大，实际应用能力较差，还是得靠人工灵活处理。”

　　不过据王彦翔观察，实际应用能力还需分场景看。“一部分场景低代码确实有一定限制，特别是对个性化交互有较高要求、用户数和并发数特别高、或系统集成特别复杂的应用，但在大部分面向企业内部的应用、To B应用场景都已经相当成熟，且能覆盖企业数字化需求的大部分场景需求。”

　　“相比传统方式，注入大模型能力的低代码工具可帮助用户简化很多技术知识点或软件工程问题，用户对数据结构、网络原理等不需要有太深理解。同时，低代码加上AI可以解决一些灵活性问题，对细节数据的处理本身是一种很好的加强。”腾讯云云开发负责人表示。

　　他指出，“AI编码领域这一两年可能真的会有一两个‘现象级’产品出来，甚至现在已经有点苗头了，比如Bolt.new等等产品就是生产方式的颠覆，明年可能会有比较能看出来哪个产品会有这种潜力。”

　　王彦翔则认为，该赛道发展将经历三个阶段：一是当下进一步降低门槛和提升效率；二是1-2年内，Copilot能力逐步成熟，从平台层面提供更全面、更强大的AI开发助手，开发层面提供从需求分析、设计、开发、测试、部署到运维等的全生命周期深度支撑能力，平台AI能力也更多地下沉到应用；三是3-5年或以后，智能应用开发平台不仅融合了低代码、高代码、无代码乃至传统编码的协同，其核心在于生成式AI技术的深度融合与应用，开发范围逐渐转向AI原生应用。

　　越来越多AIGC+低代码场景正在落地，释放软件开发生产力，但王彦翔表示，AIGC和大模型毫无疑问会颠覆软件开发方式和低代码市场，但这可能需要更长的时间去演变和探索。

　　据他总结，当前落地的场景仍然存在场景单一、应用程度浅、可用性一般等问题，还有更多能力仍然在实验室阶段，尚未落地。此外，大模型幻觉、落地成本高、数据安全性等问题始终存在，短期内难以彻底解决。

　　腾讯云云开发负责人认同大模型幻觉的确存在，不过表示“AI辅助开发工具已经发展到了工程级，一定程度上可以通过技术手段去规避幻觉问题，甚至提升其准确性。”他认为，工程级别本身就规范了使用场景，通过框定一个小范围，把大模型变成底层功能，在小领域、小场景里使用，效果将好很多。

　　成本方面，他告诉记者，可通过缓存机制降本。“每次大模型生成数据的成本其实不低，但我们不是做搜索引擎，不需要做那么大范围的检索，很多缓存手段可以解决成本问题。当然最终效果怎样，我们仍在探索。”

　　“在私有化场景下，部署一套用于支持低代码平台的大模型需要考虑算力、模型以及调优和支持服务的成本，可能需要几十万量级的投入，与此对应的是采购一套本地化部署的低代码平台项目金额往往也在几十万人民币的投入。”王彦翔则表示。

　　此外在王彦翔看来，几乎所有低代码产品都已经集成了AI的能力，但目前集成能力深度和丰富度不一。

　　“很多无代码平台都是传统SaaS厂商在做，对原有SaaS软件做延伸，解决部分定制化，比如调样式调排版，或者简单写个表单，不具备很强的灵活性，所以基本上是给自己的人员去用，其实开发成本不高。”有软件从业者告诉记者。

　　此外，该从业者并不看好低代码大模型的模式，她认为“数据模型自动生成和表单自动构建，不需要专属的模型。” （财联社）

Kimi发布视觉思考模型k1；无问芯穹开源全球首款端侧全模态理解模型；微软 CE(图9)

　　腾讯控股在港交所公告，于12月16日回购172万股股份，每股回购价范围在403.8至410.8港元，共计耗资约7亿港元。（第一财经)

　　回顾2024，大模型经历百模大战，底层技术的不断进化与革新，推动AIGC行业快速从概念走向实际应用场景，特别是在更多垂直场景中扮演着重要角色，如工业、医疗、文娱、消费、金融等场景，AIGC正以其独特优势加速行业革新。同时，出海是中国AI企业破除内卷的共识，在此过程中，如何将中国AI技术推向全球舞台并发展壮大，也是业界需要思考和关注的焦点。

　　在此背景下，今年2024极新AIGC峰会正式启动，将于2024年12月26日-27日在深圳、香港两地举办。峰会围绕“重度垂直”这一主题，将邀请AI产业、智能硬件、出海跨境等领域的知名企业家、投资人和专家学者，探讨AIGC在千行百业的深度应用与未来发展趋势，分享AI出海的方向和成功案例，为参会者提供宝贵的启示，助力AIGC行业打破内卷、发现新的增长机遇，共同推动中国AI技术出海，闪耀国际舞台。

　　极新是垂直于产业AI的创投和行业研究媒体，致力于陪伴和记录科技企业进步和产业成长。已与多家平台和创新企业深度对话和合作，包括华为云、阿里云、百度智能云、金山云、飞书、火山引擎、钉钉、东软、Zoho、容联云、百家云等平台企业，以及智谱AI、百川智能、格灵深瞳、深势科技、百图生科、瑞莱智慧、创客贴、生数科技等高成长公司。

上一篇：OA选型必看一文讲清4大厂商优劣势
下一篇：从儿时的童趣到线上热潮“躲猫猫”小程序开发全揭秘

网站首页

关于JDB电子

产品中心

新闻资讯

成功案例

合作加盟

人才招聘

联系JDB电子

客户留言

友情链接：