11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。
AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。
微软在官网开源了,最新动态蛋白质生成模型BioEmu-1。BioEmu-1能在单个GPU上每小时生成数千种蛋白质结构,生成效率比传统MD模拟提高了几个数量级。在预测人类血管紧张素转换酶2的构象柔性方面,BioEmu-1成功揭示了ACE2在不同构象下的动态特性,证明了其在解析生物大分子相互作用及预测蛋白质功能方面的巨大潜力。
微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0,可将DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型,变成可在计算机使用的AIAgent。与V1版本相比,V2在检测较小的可交互UI元素时准确率更高、推理速度更快,延迟降低了60%。当任务是“点击设置按钮”时,OmniParser不仅提供了设置按钮的边界框和ID提供了其功能描述,颗显著提高了模型的准确性和鲁棒性。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、巨量引擎旗下AIGC工具“即创”正式版上线巨量引擎的AIGC工具“即创”正式上线,提供多种内容生成方式,包括AI脚本生成、智能成片和数字人等。用户反馈新版本在图像质量和细节处理上显著下降,导致微软搜索部门负责人JordiRibas承认并采取措施恢复旧版。
微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen2.5-14B和Llama-3.3-70B。在与其他类似规模和更大规模的模型比较中,phi-4在12个基准测试中的9个上优于同类开源模型Qwen-2.5-14B-Instruct。
微软AzureAI团队宣布开源视觉模型——Florence-2。Florence-2是一个多功能视觉模型,可提供图像描述、目标检测、视觉定位、图像分割等。尤其是在微调后,Florence-2在公共基准测试中的性能与更大参数的专业模型相媲美。
9月25日,2024开放原子开源生态大会在北京成功开幕,大会以“开源赋能产业,生态共筑未来”为主题,来自产学研用各领域的千余位代表齐聚于此,聚焦地方开源实践、企业开源建设思路、开源生态建设等内容开展探讨与交流,突出人工智能、云原生等重点领域。深信服千里目安全技术中心CTO王振兴受邀出席大会,在安全与密码产业实践分论坛上发表《AI时代下,对开源软件安全防护的新思考》的主题演讲。深信服将继续与全行业共同推动开源软件安全防护能力的创新和发展,为构建更加安全、稳定、可靠的开源生态、网络安全环境提供坚实的技术支持和保障。
9月26日,“2024中国数字经济创新发展大会”在汕头成功召开,大会汇聚业界精英,旨在全面探讨在新形势新挑战下,如何“健全数据安全体系构建可信流通环境”。在「数据安全与合规发展专题」分论坛上,工业和信息化部电子第五研究所软件与系统研究院数据治理中心副主任李帅,分享了《2024上半年网络安全漏洞态势报告》,该报告由工业和信息化部电子第五研究所软件与系统研究院科研创新部与深信服千里目安全技术中心联合编写。深信服将继续与全行业共同推动网络安全漏洞治理能力的创新和发展,为构建更加安全、稳定、可靠的网络环境提供坚实的技术支持和保障。
7月3日,微软在官网开源了基于图的RAG——GraphRAG。为了增强大模型的搜索、问答、摘要、推理等能力,RAG已经成为GPT-4、Qwen-2、文心一言、讯飞星火、Gemini等国内外知名大模型标配功能。同时GraphRAG对tokens的需求很低,也就是说可以帮助开发者节省大量成本。