11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本文介绍了AI日报栏目,聚焦人工智能领域最新动态。主要内容包括:腾讯开源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能,以及腾讯优图开源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。
本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。
浙江大学与魔芯科技团队合作,基于昇腾平台NPU开发了首个三维模型生成算法Img2CAD。该技术突破性地将草图、图片等多模态输入通过Transformer结构高效转化为三维几何信息,无需可微渲染器,完整在NPU上实现训练和推理。研究成果可生成高精度3D模型,直接导入CAD软件编辑,已应用于3D打印、数字制造等领域。项目完成3篇论文,包括1篇中科院1区期刊和2篇CCF-A类会议论文,部分成果实现商业化落地。该技术标志着智能三维内容创作进入"低门槛、高效率、高质量"新阶段,未来将为工业设计、AR/VR等行业提供创新动能。
本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。
省委常委、市委书记刘非赴杭州市余杭区调研科技创新工作,强调要深入学习贯彻重要指示精神,全面落实省委"一个首要任务、三个主攻方向、两个根本"总体部署。调研期间,刘非实地考察思看科技公司,详细了解其3D视觉数字化技术研发成果及在航天、大飞机等重大项目的应用情况,勉励企业要着眼世界前沿,加大创新力度,在3D视觉数字化领域实现更大突破。余杭�
2025年3月18日,思看科技全新发布KSCAN-X智能无线超广大面幅三维扫描仪,该系列产品融合智能无线和混合摄影测量技术的强劲实力,以无界扫描能力重新定义工业大范围扫描的新标准。KSCAN-X,集全无线、超大面幅、超大景深、超快扫描等核心优势,轻松实现航空航天、能源重工、轨道交通等行业超大型、中大型复杂零部件的高精度三维测量,助力装备制造业效率跃升、精准质控。-超清细节:支持数据实时网格化,网格重建速度更快、数据质量更精细,轮廓细节清晰可见。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、腾讯混元推出5个开源3D模型:30秒生成,兼容多平台腾讯混元宣布推出五个全新开源3D生成模型,基于Hunyuan3D-2.0,具备更快的生成速度和更丰富的细节。通过精细的训练过程,OLMo232B在多项基准测试中超越了GPT-3.5Turbo和GPT-4omini,展现出卓越的性能和更高的训练效率。
在2025年全国两会期间,人工智能领域的前沿话题——具身智能,成为了热议焦点。具身智能作为人工智能的新兴赛道,正以爆发式增长态势,引领新一轮产业变革。天娱数科将继续秉持创新精神,加大技术研发投入,持续优化具身智能大模型一体机性能,进一步提高3D数据质量和规模,探索更多前沿技术在具身智能领域的应用,不断巩固和提升自身竞争力,为推动具身智能产业发展发挥更大的引领作用。
全面赋能自主移动机器人,实现高精度3D视觉感知与先进AI边缘计算重点摘要:●凌华智能携手立普思推出AMR3DxAI视觉感知方案,采用NVIDIAIsaacPerceptor技术,专为自主移动机器人设计,具备增强的3D视觉能力,提供比LiDAR更宽广的视野与更高的分辨率。●解决方案包含LIPSAMR™PerceptionDevKit,配备凌华智能DLAP-411-Orin平台与LIPSedge™3D相机,为智能制造和仓储物流应用提供高精度3D感知能力。欢迎关注凌华智能官方微信公众号:凌华智能,或访问www.adlinktech.com.cn了解更多。
摘要:三星2025年电视将搭载EclipsaAudio技术,覆盖CrystalUHD系列至NeoQLED8K系列电视前沿的3D音频新技术,将引领家庭娱乐迈向全新境界1月3日,韩国三星电子宣布,2025年新品电视和条形音响产品将搭载与谷歌合作开发的创新3D音频技术——EclipsaAudio[1]。这项技术将助力内容创作者打造生动、沉浸式的音频内容,并在三星电视上实现流畅播放,为消费者带来前所未有的视听盛宴。我们期待看到创作者们利用这项技术打造出新颖且富有创意的音频体验。