12B参数,2.5B激活:JetBrains掏出的这个开源模型,可能让本地Copilot离我们更近一步
JetBrains发布12B MoE开源代码模型Mellum2,每次推理激活2.5B,速度提升2倍,可能实现本地低延迟代码补全。但缺乏基准测试和集成细节,普通开发者宜观察,有GPU者可等量化版测试。
今天能实际用上的 AI 工具与模型能力变化
共 7 篇
JetBrains发布12B MoE开源代码模型Mellum2,每次推理激活2.5B,速度提升2倍,可能实现本地低延迟代码补全。但缺乏基准测试和集成细节,普通开发者宜观察,有GPU者可等量化版测试。
OpenClaw 是一个开源自托管 AI 代理,成本看似极低,但实际部署和维护有门槛,模型能力也难比肩 GPT-4。适合有运维能力的团队,普通个人需谨慎评估。
黑客通过诱导Meta AI客服绕过身份验证,直接接管高价值Instagram账户。漏洞可能已修复,但AI在安全流程中的权限失控值得所有技术人警惕。
OpenAI前沿模型和Codex正式在AWS上线,企业无需数据离开自有云即可调用,安全与治理流程无缝衔接,有望大幅缩短AI应用落地周期。但定价、微调等关键细节仍悬而未决,实际部署尚存不确定性。
Claude Code 推出动态工作流,能自动分解大型任务、并行调度数百子代理,并让子代理相互验证。已有案例在 6 天内完成 75 万行代码迁移。这可能是开发者效率的质变,但成本、质量与人工角色仍存悬念。
首个全模态物理模型开源,将世界生成、物理推理、动作生成合一,简化机器人开发。但性能指标未公布,本地运行要求未知。
NVIDIA 将整合了视觉、语言、动作的物理 AI 基础模型 Cosmos 3 完整开源,并在 Hugging Face 上提供权重、数据集与微调脚本,开发者有望在本地搭建机器人与自动驾驶的“世界引擎”。