首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:“即创”正式版上线;2024胡润中国AI企业50强榜单;通义万相推2.1视频模型;微软开源超强小模型Phi-4

2025-01-09 15:17 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、巨量引擎旗下AIGC工具“即创”正式版上线

巨量引擎的AIGC工具“即创”正式上线,提供多种内容生成方式,包括AI脚本生成、智能成片和数字人等。该平台通过深度学习和自然语言处理,用户只需输入主题即可生成高质量文本和视频内容。新增的爆款裂变和一键过审功能,帮助创作者快速响应市场变化,提升创作效率和内容合规性。

image.png

【AiBase提要:】

🌟 即创支持多种内容生成,提升创作效率。

📊 新增爆款裂变和一键过审功能,帮助创作者快速响应市场。

🎨 AI 技术引领内容创作革命,鼓励创作者探索新工具。

详情链接:https://top.aibase.com/tool/douyinjichuang

2、通义万相推2.1视频模型 大幅提升复杂运动能力

阿里旗下的通义万相视频生成模型在最新2.1版本中实现了重磅升级,推出了极速版与专业版,分别聚焦于高效性能和卓越表现力。这一版本在处理复杂运动和还原真实物理规律方面取得了显著进步,提升了视频的电影质感和指令遵循能力。

image.png

【AiBase提要:】

🚀 新版本分为极速版与专业版,分别提升高效性能与表现力。

🐱 生成的视频细节丰富,成功解决了“鬼画符”问题,实现精准中英文文字生成。

🎬 运镜效果如同电影大师,能够自动调整镜头,提升视频艺术性。

详情链接:https://tongyi.aliyun.com/wanxiang/videoCreation

3、微软正式开源超强小模型Phi-4

微软在Hugging Face平台上发布了小型语言模型Phi-4,参数量为140亿,表现优异,超越了多款知名模型如GPT-4o和Llama-3.1。Phi-4在数学竞赛AMC中获得91.8分,并在MMLU测试中取得84.8分,展现了强大的推理能力。该模型采用创新的合成数据生成方法,支持长达16k的上下文长度,适用于消费级硬件。

image.png

【AiBase提要:】

🧩 微软推出的Phi-4模型参数仅140亿,却在性能测试中超越了GPT-4o和Llama-3.1等多个知名模型。

📈 Phi-4在数学与推理能力方面表现突出,特别是在AMC和MMLU测试中取得了高分。

🌍 该模型已开源并支持商业用途,吸引了大量开发者和AI爱好者的关注。

详情链接:https://huggingface.co/microsoft/phi-4

4、全新视频修复技术 SeedVR:模糊变高清,可处理任意长度视频

在数字媒体迅速发展的背景下,视频质量的提升成为了重要议题。南洋理工大学与字节跳动的研究团队推出的SeedVR技术,利用创新的移动窗口注意力机制,显著改善了视频恢复效果,特别是在处理AI生成视频时表现突出。该技术不仅能够处理任意长度的视频,还能有效修复画面细节,为用户带来更真实的视觉体验。

image.png

【AiBase提要:】

🌟 SeedVR利用移动窗口注意力机制,成功提升对长视频序列的处理能力。

🎥 该技术采用较大的窗口尺寸,显著提高了高分辨率视频的恢复质量。

🚀 结合多种现代技术手段,SeedVR在多个基准测试中表现卓越,尤其适用于AI生成的视频。

详情链接:https://iceclear.github.io/projects/seedvr/

5、Adobe 的 TransPixar 将烟雾、反射等透明效果无缝融入场景

Adobe Research与香港科技大学联合开发的TransPixar系统,革新了视觉特效制作,尤其是在处理透明元素方面。该技术通过生成包含Alpha通道的视觉效果,显著提高了制作效率,降低了成本。TransPixar的推出正值行业对高质量特效需求激增之际,预示着未来影视制作流程的变革。

【AiBase提要:】

🌟 TransPixar通过创新的AI技术,能够在有限的训练数据下生成高质量的透明效果,简化特效制作流程。

💡 该系统不仅提升了大型制作团队的工作效率,还为小型工作室降低了制作成本,使其能够实现复杂特效

🚀 TransPixar在实时应用领域展现出巨大潜力,能够快速生成透明效果,适用于视频游戏和增强现实等场景。

6、字节联合高校出品!STAR 模型:提升视频清晰度和分辨率

南京大学研究团队与字节跳动、西南大学联合推出的STAR技术,通过文本到视频模型实现视频超分辨率处理,显著提升低分辨率视频质量。该技术结合时空增强方法,适用于视频分享平台上下载的低清晰度视频。研究团队已在GitHub发布预训练模型和推理代码,使用过程简单,推动了视频处理领域的进步。

image.png

【AiBase提要:】

🌟 新技术 STAR 结合文本到视频模型,实现视频超分辨率,提升视频质量。

🛠️ 研究团队已发布预训练模型和推理代码,使用过程简单明了。

📩 提供联系方式,鼓励用户与研究团队进行交流与探讨。

详情链接:https://github.com/NJU-PCALab/STAR

7、Stability AI 推出 SPAR3D:单图像生成3D 对象一秒钟搞定

在CES展会上,Stability AI推出了SPAR3D,这是一种创新的两阶段3D生成技术,能够在不到一秒的时间内从单个图像中生成精确的3D对象。SPAR3D不仅提供了高效的3D原型设计方式,还允许用户实时编辑生成的3D对象,提升了创作灵活性。

image.png

【AiBase提要:】

⚡ 实时生成能力:SPAR3D能在一秒内从单张图像生成完整的3D对象,并支持快速编辑。

🔍 精确的结构预测:提供准确的几何形状和360度视图,包括隐藏区域,确保高分辨率输出。

🚀 开放的使用政策:支持商业和非商业用途,用户可通过多种方式获取和使用该模型。

详情链接:https://stability.ai/news/stable-point-aware-3d

8、2024年238款生成式人工智能服务在国家网信办完成备案

国家互联网信息办公室于1月8日发布公告,明确截止2024年12月31日,已有302款服务完成备案,其中238款为2024年新增。这表明该领域快速发展,更多新服务获得官方认可。公告还要求提供舆论属性服务的企业进行备案,并提升已上线应用的透明度,确保合规性和安全性。

【AiBase提要:】

🌟2024年,共302款生成式人工智能服务在国家网信办完成备案,新增238款。

🔍 提供舆论属性服务的企业可通过属地网信部门进行备案,确保合规性。

📝 已上线应用需公示所使用的已备案服务信息,提升透明度。

9、2024胡润中国人工智能企业50强榜单:科大讯飞第二、商汤科技第三

2024胡润中国人工智能企业50强榜单正式发布,寒武纪以2380亿人民币估值位居榜首,展现出其在AI领域的强大实力。科大讯飞和商汤科技分别以1160亿和500亿的估值紧随其后。榜单显示,北京、上海和深圳是主要的AI企业集聚地,合计占据80%的上榜企业。

【AiBase提要:】

🌟 寒武纪以2380亿元估值位居榜首,科大讯飞和商汤科技分别排第二和第三。

🏙️ 北京、上海、深圳成为人工智能企业的主要集聚地,合计占据80%的上榜企业。

📊 该榜单侧重非具身智能企业,评选范围不包括机器人和智能家居等领域的公司。

10、你绝对想不到!重复这个简单指令让AI生成代码快100倍

BuzzFeed的高级数据科学家麦克斯・伍尔夫进行了一项实验,使用Claude3.5语言模型,通过反复请求AI改进代码,成功将原本657毫秒的运行时间缩短至6毫秒,提升了100倍的性能。实验中AI展现出其对“更好代码”的独特理解,自动添加企业特性。

【AiBase提要:】

🌟 AI通过反复指令提升代码性能,原代码运行时间从657毫秒降至6毫秒。

💡 AI在代码中自动添加企业特性,展现出其对“更好代码”的独特理解。

🛠️ 提示工程依然重要,精确的请求可以加速结果生成,但仍需人工开发者进行验证和修复。

11、英伟达发布Groot Teleop 技术 允许通过Apple Vision Pro来训练机器人

英伟达在CES展会上推出了一系列创新技术,旨在加速人形机器人的开发,尤其是在工业和制造领域。通过Isaac GR00T蓝图,开发者可以利用模仿学习生成大量合成运动数据,从而训练人形机器人。这一技术不仅降低了数据收集的时间和成本,还通过Cosmos平台生成物理意识视频,推动物理人工智能的发展。

image.png

【AiBase提要:】

🚀 英伟达推出Isaac GR00T蓝图,利用模仿学习生成合成运动数据,加速人形机器人开发。

📊 Cosmos平台经过18万亿数据训练,生成物理意识视频,促进物理人工智能发展。

🤝 多家机器人公司已采用Isaac GR00T技术,展现出良好的应用效果。

12、惊悚发明!工程师用 ChatGPT 制作机器人步枪,OpenAI 立刻出手

近期,工程师STS3D创造了一款机器人步枪,能够通过ChatGPT指令进行瞄准和射击,展现出令人惊叹的反应速度和准确性。这一发明引发了广泛讨论,尤其是关于将科幻技术变为现实的担忧。OpenAI迅速回应,指出该行为违反了公司政策,禁止利用其服务开发武器。

【AiBase提要:】

🌐 OpenAI迅速切断与开发机器人步枪工程师的关系,因其违反使用政策。

🤖 STS3D的机器人步枪可以根据ChatGPT的指令进行瞄准和射击,展现出高准确性。

⚔️ 尽管OpenAI去年修改了政策,但仍禁止使用其服务开发任何形式的武器。

13、因用户投诉,微软回滚Bing AI图像生成器升级、重返旧版DALL-E

微软近期因用户对Bing图像生成器新版本的不满,决定回滚至旧版DALL-E模型。用户反馈新版本在图像质量和细节处理上显著下降,导致微软搜索部门负责人Jordi Ribas承认并采取措施恢复旧版。

image.png

【AiBase提要:】

🌟 微软因用户投诉决定回滚 Bing 图像生成器的新版本,旨在改善用户体验。

🎨 升级后的图像生成效果不如预期,用户反映细节和质量明显下降。

🔧 Jordi Ribas 表示将重返旧版 DALL-E 模型,预计需几周时间完成这一调整。

举报

  • 相关推荐
  • 宜信唐宁乌镇倡议:设首席AI官让人工智能更有温度

    在2025年世界互联网大会乌镇峰会上,宜信公司CEO唐宁前瞻性地呼吁企业设立“首席AI官”,以此推动人工智能从冰冷的效率工具,演进为富有人文温度的协同伙伴。这一主张不仅呼应了峰会“共筑开放合作、安全普惠的数智未来”的主题,更为AI的发展路径注入了“暖心”与“共情”的关键维度,描绘出一幅人机深度协作、效率与温度并重的新图景。在乌镇峰会“前沿人工智能

  • 百惠金控:人工智能概念股活跃 政策与资本双动力带动行业升温

    百惠金控指出,近期人工智能及人形机器人概念股在香港市场表现持续活跃,市场气氛明显升温。受行业发展红利驱动,包括香港及亚洲科技板块在内的多地市场相关板块均出现正面反应。在港上市的相关企业如MINIMAX-WP、优必选、三花智控及金山云等股价纷纷上扬,反映资本市场正重新评估人工智能大模型及机器人产业的成长空间与潜在商业价值。此外,新上市的诺比人工智能科技首日股价飙升超300%,进一步印证市场对优质AI标的的热烈追捧。政策层面,中国及香港政府均推出多项支持措施,构建从上游核心零部件到下游应用场景的完整政策生态。百惠金控亦积极参与推动行业发展,并在资本市场扮演关键角色,曾协助“人形机器人第一股”优必选在港交所上市。展望未来,香港市场凭借“一国两制”优势、国际金融中心地位与科创生态完善,有望成为汇聚全球资本、技术与企业的区域科创枢纽。

  • 深耕AI+教育!简知科技入选2025广州市“人工智能+教育”典型案例及“人工智能+”百家案例精选荟

    2025年12月24日,广州举办人工智能算力应用及产业发展联盟年度峰会。简知科技凭借其在“人工智能+教育”领域的实践成果,成功入选2025年广州市“人工智能+教育”典型案例及“人工智能+”百家案例精选。这体现了政府和行业对其推动AI与教育场景融合、建设智能教育服务生态贡献的肯定。其核心自研的“简智AI大模型”已通过国家生成式人工智能服务备案,为教学流程管理、知识体系构建与个性化学习等关键环节提供技术支撑。公司将持续深化AI与教育全场景的融合应用,助力建设更加智能化、个性化的终身学习体系。

  • 2026高交会人工智能产业链展、机器人产业链展招商正式启动

    第二十八届中国国际高新技术成果交易会(高交会)将于2026年11月26日至28日在深圳举办。本届高交会首次以“双馆并行、各自成链”方式,独立呈现人工智能与机器人两大产业板块,标志AI正从“赋能角色”走向“产业主角”,机器人则迈入以具身智能为核心的系统化发展新阶段。展会旨在全面呈现新一代智能技术对产业体系与社会形态的深刻重塑,打造从算法、算力、数据到载体、场景的完整产业闭环,成为全球最具前瞻性的智能科技展示高地。

  • 搭载人工智能,数字王国深化全面转型

    数字王国集团发布HANBAO.AI一站式影像创作平台,旨在推动人工智能在文娱和科创领域的场景化应用。该平台聚合AI大模型,提供覆盖文本、图像和音频的集成工具库,赋能创作者高效输出高阶影像。数字王国围绕新工艺、新模态、新场景、新赋能持续探索,并联合十余家标杆企业构建“人工智能+”战略联盟,加速技术迭代与创意提炼在关联产业的部署与运作。

  • GEO内容策略工具哪个好?品牌AI排名曝光度低怎么办?

    在人工智能技术重塑信息检索范式的今天,全球商业竞争正迅速向一个全新的维度迁移——生成式引擎优化。当用户习惯于向ChatGPT、文心一言等AI助手直接提问而非键入关键词时,传统的搜索引擎优化策略面临失效。品牌如何在这一变革中确保自身被"看见"、被"推荐",成为决定未来市场地位的核心命题。GEOBase应运而生,作为一款企业级智能数据平台,它专为生�

  • NVIDIA RTX 加速 PC 端 4K AI 视频生成,LTX-2 与 ComfyUI全面升级

    2025年是PC端AI发展的突破之年,小语言模型(SLM)准确率相比2024年提升近2倍,显著缩小了与云端大语言模型(LLM)的差距。NVIDIA在CES上宣布了一系列针对RTX设备的AI升级,以解锁PC上的生成式AI性能。通过优化ComfyUI、开源LTX-2视频生成模型、加速Ollama和llama.cpp等工具,实现了视频/图像生成性能最高提升3倍、显存占用最多降低60%,以及SLM推理性能最高提升35%。这些改进让用户能在本地RTX AI PC上无缝运行先进的工作流,同时享受隐私、安全和低延迟优势。全新的视频生成工作流和由Nexa.ai推出的Hyperlink本地智能搜索工具,将进一步推动生成式AI在2026年全面走向大众创作者、游戏玩家和生产力用户。

  • 2025 长视频:「内容为王」不变,「体验为王」上位

    2025年的长视频行业,似乎正在发生一种微妙但直观的变化。 过去两三年里,“爆款率”几乎成为了衡量平台成败的唯一指标,其核心逻辑仍是传统意义上的“内容为王”。 然而,爆款供给的天然不确定性让这一逻辑遭遇瓶颈:当S+级大剧播完,如何填补“空窗期”以抵御用户流失?如何引导用户从“追IP”转向“追平台”,构建对品牌本身的深度粘性? 这成为了所有长视频平台

  • 强化系统整合及运转效能 盛趣AI工具平台内部上线

    世纪华通旗下盛趣游戏近日正式上线自主研发的AI工具平台,深度整合多个主流大模型底层能力,并针对游戏开发核心痛点专项优化。该平台聚焦智能翻译、语音合成、角色生成、音效生成、AICG配音、数据分析及图片高清化七大功能,已成功应用于《龙之谷世界》等重点项目。通过本地化部署,平台有效降低数据安全风险与运行成本,在数字资产创作、质量检测、客户服务等关键环节发挥重要作用。例如,ARTI平台实现内容生产效率提升60%-80%,大幅压缩传统制作周期。公司正加速推动AI技术与业务深度融合,成立AI发展与管理委员会,并将AI工具应用成效纳入核心KPI考核体系,从制度与人才双维度保障战略稳步推进。

  • 从买量到内容驱动:视频号发力,搅局小游戏行业?

    ​视频号又放大招。 12月29日,微信视频号正式推出“小游戏变现任务”,为创作者与游戏行业带来新的生态联动信号:满足千粉条件的创作者,可通过发布优质原创短视频挂载小游戏推广链接,获取现金收益,部分游戏分成比例达30%。 这一功能落地并非孤立动作,而是视频号在小游戏推广领域的重要补位——此前,平台已通过直播推游戏、主播激励计划等布局该赛道。 此举

今日大家都在搜的词: