AI视野：Pika1.0首批用户资格揭晓；Runway官宣下场通用世界模型；妙鸭相机推出AI修图；抖音正式上线AI创作功能

2023-12-12 15:18 · 稿源：站长之家

📰🤖📢AI新鲜事

Pika1.0首批用户资格揭晓

Pika Labs最新视频生成产品Pika1.0引起轰动，已开始向候补名单用户发放使用资格。Pika1.0以文生成视频为特色，提供3秒视频快速生成、背景修改等功能。用户可在推特或邮箱确认是否成为首批体验者。

【AiBase提要】:
🚀 Pika1.0发布: Pika Labs推出视频生成工具Pika1.0，引起广泛关注。
📧 首批用户资格: Pika向部分候补用户发放体验资格，用户可查收确认邮件。
🎥 功能亮点: Pika1.0支持文生成视频，提供快速生成、背景修改等特色功能。

英伟达2023年投资了35家人工智能公司

英伟达在2023年大幅扩大对AI初创企业的投资，已投资35家公司，涵盖范围从大型新人工智能平台到小型初创企业，成为人工智能领域最活跃的投资者之一。

【AiBase提要:】
🚀 英伟达在2023年成为AI领域最活跃的投资者之一，投资35家公司，投资范围广泛。
💼 投资标准以技术相关性为主，注重与使用其技术、依赖其技术的公司建立紧密关系。
🌐 投资组合包括与OpenAI竞争对手Inflection AI和其他公司，强调对技术基础的依赖。

体育画报出版商发生AI丑闻后解雇CEO

著名杂志《体育画报》The Arena Group宣布，其董事会已终止了其首席执行官罗斯·莱文索恩的雇佣关系。

【AiBase提要:】
🔍 体育画报出版商解雇CEO罗斯·莱文索恩，公司曾发布由不存在的作家署名的人工智能生成文章，引起争议。
📰 揭露后，两名高管被解雇，公司高级副总裁宣布终止与莱文索恩的雇佣关系。
👥 新的临时CEO由多数投资者马诺吉·巴尔加接任，公司回应解雇与人工智能丑闻无关。

抖音正式上线AI创作功能最新AI特效破6亿次播放

抖音最新推出AI创作功能，博主通过使用AI生成的漫画特效制作创意视频，受到热烈关注，标志着AI技术在短视频创作领域的广泛应用。

【AiBase提要:】
🎨 AI创作横空出世:抖音正式推出AI创作功能，博主们通过AI生成的漫画特效创作独特视频，引起用户极大兴趣。
🌐 热门特效引爆关注:博主运用AI漫画特效、古风形象生成等功能，视频播放次数突破6亿，展示AI技术在短视频创作中的威力。
🚀 AI赋能创意生态:引入AI绘画技术降低门槛，普通人也能轻松融入AI创作，预示着AI技术在创意领域将迎来更广泛应用。

抖音博主用AI生成春晚图网友辣评:这是过春节还是过鬼节?

抖音知名博主通过AI技术创作了中式春晚图，但在指令发布后图像变幻莫测，引发网友热议，质疑图像中的怪异现象。

【AiBase提要:】
🎨 博主通过AI技术创作中式春晚图，呈现奇幻太空场景。
👻 指令发布后图像变化引发网友关注，出现怪异现象，疑似“春晚变鬼节”。
💬 网友热议中发现AI生成图像的局限性，同时推动更多人涉足AI领域。

Astra Starter Templates 集成 ZipWP AI 网站生成器

Astra Starter Templates 宣布与 ZipWP AI 网站构建器整合，用户可在60秒内创建完整网站，包括内容和图像。

Starter Templates3.5.2:全新基于 AI 的模板工具包库:

https://wpastra.com/changelog/version-3-5-2/

【AiBase提要】
🚀 模板整合AI构建器: Astra Starter Templates整合ZipWP AI构建器，提供280+可自定义网站模板，支持用户快速创建专业外观网站。
🤖 ZipWP AI构建器功能: ZipWP利用人工智能在60秒内创建完整WordPress网站，无需编码或技术知识，提供自动化设计和内容生成。
💼 灵活选择高级版: ZipWP提供免费和高级版，高级版每天可创建10个网站，价格为399美元/年，支持在开源WordPress环境中定制使用。

🤖📈💻💡大模型动态

李飞飞联袂谷歌推出视频生成模型W.A.L.T

谷歌与李飞飞的斯坦福团队联合推出基于Transformer的视频生成模型W.A.L.T，采用因果编码器和窗口注意的变压器架构，在图像和视频领域取得Gen-2水平的逼真效果。

论文地址:https://walt-video-diffusion.github.io/assets/W.A.L.T.pdf

【AiBase提要:】
🌟 W.A.L.T利用因果编码器和变压器架构将图像和视频压缩到共享潜在空间，实现了联合训练和生成，取得SOTA性能。
🚀 两个关键决策使W.A.L.T成功解决视频生成建模难题，采用潜在视频扩散模型，在多个基准测试上表现出色。
📄 W.A.L.T的突破性设计标志着视频生成进入新时代，为AI视频技术拓展发展空间，展示了Transformer的广泛适用性。

Runway官宣下场通用世界模型

Runway公司宣布发展通用世界模型（GWM），旨在解决AI视频领域的难题。该模型旨在模拟广泛和多样的真实世界情景，提高视频生成系统的理解和逼真度。公司表示将面临许多研究挑战，招募团队应对。

【AiBase提要】:
🌐 Runway宣布开发通用世界模型（GWM）解决视频AI难题。
🤖 GWM旨在模拟真实世界情景，提高视频生成系统逼真度。
🚀 公司面临挑战，招募团队应对，迎接人工智能视频新时代。

阿里推出东南亚专用AI大语言模型SeaLLM

阿里研究部门发布SeaLLM，首个专为东南亚市场设计的大语言模型，在语言和安全任务上表现优异，突显阿里对该地区增长市场的重视。

【AiBase提要:】
🚀 阿里推出首个专为东南亚市场设计的SeaLLM，展现在该地区的市场拓展雄心。
🌐 SeaLLM在语言和安全任务方面优于其他开源模型，经过越南语、印尼语等八种语言数据集的预训练。
🔗 SeaLLM的性能超越其他大型语言模型，尤其在非拉丁语系任务和英语与低资源语言翻译方面取得显著成果。

Meta AI开源T2V模型AVID 可修复视频改变纹理

Meta AI最近开源的T2V模型AVID具备先进的修复和扩展能力，通过文本编辑视频，支持修复视频、更改对象、改变纹理和颜色，甚至删除或替换视频内容。

项目地址:https://zhang-zx.github.io/AVID/

【AiBase提要:】
🔧 先进修复与扩展能力: Meta AI的AVID模型开源，具备先进的运动模块和可调节的结构引导，能有效修复和扩展视频，处理不同修复类型且质量高。
🔄 时间一致性与可变长度处理: AVID解决文本引导视频修复的挑战，引入新颖的时间多重扩散采样管道，具备中帧注意力引导机制，可稳健处理不同视频持续时间范围。
👩‍💻 培训阶段方法: 在培训阶段，AVID模型采用两步方法，集成运动模块和优化视频数据，保留UNet参数并专门训练结构指导模块，推理过程中构建连续帧片段并计算结果。

🤖📱💼AI应用

妙鸭相机推出AI修图

妙鸭相机的新AI修图功能引起关注，通过数字分身和大模型算法实现智能修脸，挑战美图秀秀等传统修图软件在美颜市场的地位。

【AiBase提要】
🚀 技术创新: 妙鸭相机推出基于大模型的“AI修脸”，以智能、快速的修图体验刷新用户对美图软件的认知。
📸 功能强大: 用户通过上传照片生成数字分身，可选择不同修脸模式，包括焕新和重塑，实现个性化、智能的修图效果。
🌐 市场竞争: 妙鸭相机的AI修图功能挑战传统美图软件，预示着修图美颜市场将迎来激烈的用户争夺战。

Google发布编程工具AlphaCode2

谷歌发布了由Gemini模型提升的AlphaCode2，是一款AI编程工具，在编程竞赛中以Python、Java、C++和Go等多语言表现优异，通过复杂技术解决了原AlphaCode的局限。

【AiBase提要:】
🚀 性能提升: AlphaCode2由Gemini模型驱动，在编程竞赛中表现显著优于前代，击败约85%竞争对手。
💻 多语言支持: 该工具在Python、Java、C++和Go等多语言中表现卓越，展现了强大的编程能力。
🔍 复杂问题解决: 利用动态规划等复杂技术，AlphaCode2能理解涉及“复杂”数学和理论计算机科学的编程挑战，解决了原版无法应对的问题。

AI绘图产品Visual Electric图片质量可媲美Adobe Firefly

Visual Electric是一个为创意过程打造的图像生成器，它拥有一个令人惊叹的图像库和相应的提示，可以激发灵感。它可以通过迭代来发展创意，尝试不同的风格和颜色。

QQ截图20231211165707.jpg

体验地址:https://visualelectric.com/

【AiBase提要:】
🎨 创意激发: Visual Electric为创意工作者提供强大的图像生成能力，通过简单输入提示即可生成高质量图像。
🖌️ 直观创作空间: 白板式界面让用户清晰看到生成过程，可随时编辑和处理图像，集成了抠图等便捷功能。
🌈 多样风格选择: 提供精心打造的多种风格，让用户轻松尝试不同创意可能性，实现直观而多样的创作。

👨‍💻💡🎯聚焦开发者

阿里推视频生成框架DreaMovin

DreaMoving是阿里基于扩散模型的视频生成框架，通过图文输入可定制高质量人类舞蹈视频。框架包含Video ControlNet和Content Guider两大组件，实现运动控制和身份保留。通过姿势序列和简单描述，如文本和图像，DreaMoving生成高保真度视频。

项目网址:https://dreamoving.github.io/dreamoving/

【AiBase提要:】
🌐 框架介绍: DreaMoving是基于扩散模型的视频生成框架，可通过图文输入生成高质量舞蹈视频。
🔄 架构解析: Video ControlNet和Content Guider是关键组件，分别实现运动控制和身份保留，适用于不同风格的扩散模型。
🎬 成果展示: DreaMoving通过姿势序列和简单描述生成高保真度的定制视频，实现身份控制和外观控制。

UCLA推出Chameleon框架，大模型表格数学推理准确率达98.78%

由UCLA等机构推出的Chameleon框架通过多工具融合，包括LLMs、视觉模型、搜索引擎等，解决大型语言模型在实时信息获取和数学推理上的不足，在表格数学推理任务上达到98.78%准确率。

项目地址:https://chameleon-llm.github.io/

【AiBase提要:】
🦎 多工具融合: Chameleon框架融合LLMs、视觉模型、搜索引擎等多种工具，弥补大型语言模型在实时信息获取和数学推理方面的不足。
📊 表格数学推理准确率: Chameleon在表格数学推理任务中表现优异，准确率高达98.78%，超越现有模型，核心在于LLM规划器生成自然语言程序。
🌐 灵感来源: Chameleon模型灵感来源于变色龙，象征大型语言模型在执行外部工具组合推理任务时的多功能性和适应性，在学术界和开发者社区受到广泛关注。

（举报）

相关推荐

关键词：

Pika

荐AI日报：苹果AI国行版或随iOS 18.6月底上线；Suno v4.5正式上线；Runway发布图像一致性参考功能

本文汇总了AI领域最新动态：1)英伟达开源语音识别模型Parakeet-TDT-0.6B-V2，提升转写效率；2)Suno音乐平台v4.5版本支持8分钟歌曲生成；3)Runway推出图像一致性参考功能Gen-4 References；4)Midjourney V7新增"Omni-Reference"图像控制功能；5)Claude将引入MCP协议提升集成能力；6)iOS18.6或为中国用户启用AI功能；7)OpenAI宣布回归非营利模式；8)Freepik发布版权安全的F-Lite图像模型；9)OpenAI以30亿美

人工智能语音识别开源软件
京东Ai给妈妈写诗京东推出AI写诗功能

目前，该功能已覆盖京东APP全量用户，操作流程为:打开应用→搜索“AI写诗”→输入姓名→生成诗句。平台提醒，诗句生成后需手动确认分享，避免误触隐私信息。

京东母亲节 AI写诗
荐AI日报：Vidu Q1正式上线；MCP SDK 正式支持流式 HTTP；抖音一季度封禁AI黑产账号260万个

本文介绍了AI领域多项重要进展：1)MCP SDK支持流式HTTP协议，提升开发效率；2)Vidu Q1视频生成模型上线，提供专业级视觉体验；3)马斯克计划筹资250亿美元开发Colossus 2超级计算机；4)Sand AI开源MAGI-1视频生成模型；5)电商AI助手Add To Cart AI优化购物体验；6)Anthropic发布Claude Code编程指南；7)真我推出支持32种语言的AI翻译耳机；8)2025年AI视频企业TOP20榜单发布；9)清华GLM大模型免费开放；10)AI面试作弊工具引争议；11)抖音AI治理封禁260万违规账号；12)全球首款具备嗅觉的机器人问世。这些创新展示了AI技术在视频生成、编程辅助、电商、翻译等领域的快速发展与应用潜力。

人工智能开发者工具技术趋势
简单AI：零门槛AI修图！3分钟免费生成专业级春日写真，摄影师要慌了！

春天看什么展？看人类花枝招“展”！四月的阳光、樱花、露营趴......拍照三件套搞起来！本工具人亲测了一款零门槛、超简单、巨好用的 AI 神器——搜狐简单 AI，从拍照到文案一站式搞定，全程不用下载，微信搜搜就能用哦~一、智能修图：路人消失术/背景替换满心期待拍出绝美的“春日花海大片”，但碰上阴天让鲜花都看起来灰突突的！还有乱入的路人甲乙丙丁和满地的�

春季活动樱花展览摄影技巧
可灵AI发布全新2.0模型：上线多模态视频编辑功能

快科技4月16日消息，据报道，可灵AI在北京举行灵感成真”2.0模型发布会，正式发布可灵2.0视频生成模型及可图2.0图像生成模型。据介绍，可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先；可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日，全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单，快手可灵1.6pro（高品质模

可灵AI 视频生成模型图像生成模型
荐AI日报：OpenAI下周或发布GPT-4.1系列；Pika全新AI视频功能Twists；商汤科技日日新V6震撼发布

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、报道称OpenAI下周重磅发布GPT-4.1系列，包含Mini版和Nano版OpenAI即将发布GPT-4.1系列及o3系列，标志着其在多模态和推理能力上的重大进展。新加坡在AI技能学习上投入的时间显著高于其他亚太国家，显示出其在AI人才培养方面的竞争力。

OpenAI GPT-4.1 多模态AI
ChatGPT上线图库功能：可管理AI生成图片

快科技4月16日消息，据报道，OpenAI近日宣布将为ChatGPT推出全新的Image Library图库功能，该功能将帮助用户更高效地管理和查看AI生成的图像。这项创新功能将逐步向所有用户开放，包括移动端和网页端的免费版、Plus版及Pro版用户。新功能的设计充分考虑了用户体验的便捷性。用户只需点击ChatGPT侧边栏的Library入口，就能进入一个直观的图像网格界面。在这个界面中，用户可以轻�

OpenAI ChatGPT Image
荐AI日报：小米首个推理大模型开源Xiaomi MiMo；快手上线AI笔记工具“喵记多”；腾讯拆分AI团队

本文汇总了AI领域最新动态：1)小米开源70亿参数大模型Xiaomi MiMo，在数学推理和代码竞赛中超越OpenAI和阿里模型；2)快手推出AI笔记工具"喵记多"，简化笔记管理；3)Luma AI发布电影级镜头控制API，降低视频生成门槛；4)腾讯重组AI团队，加大语言模型研发投入；5)Anthropic为Claude引入新语音"Glassy"；6)谷歌NotebookLM新增50+语言音频概述功能；7)xAI将发布Grok3.5模型；8)Meta推出独立AI助手应用挑战ChatGPT；9)OpenAI紧急修复GPT-4o"谄媚"问题；10)Mac本地AI助手Simular升级隐私保护；11)CameraBench项目帮助AI理解镜头运动；12)谷歌推出个性化语言学习AI工具。

人工智能 Xiaomi MiMo
第十二届百度奖学金揭晓：半数攻坚大模型，AI解锁医疗、交通新场景

4月25日，第十二届百度奖学金颁奖典礼在武汉举行的"Create 2025百度AI开发者大会"上举行。10位来自全球顶尖高校的青年学者获奖，每人获20万元科研资金。获奖者研究方向涵盖大模型、多模态学习、医疗AI等前沿领域，超半数聚焦大模型技术创新应用。百度CTO王海峰勉励青年人才共同奔赴智能时代。该奖学金自2013年设立以来已累计支持116名全球顶尖学子，提供奖金超千万元。除资金支持外，百度还通过实习、项目合作等方式搭建产学研联动平台，持续推动AI技术生态繁荣。

百度奖学金 AI开发者大会武汉无人车
美图秀秀桌面版AI修图改图能力全面接入鸿蒙电脑，开启高效适配新范式

5月8日，华为在深圳召开鸿蒙电脑技术与生态沟通会，首次展示鸿蒙操作系统在电脑端的应用。美图秀秀桌面版成为首批深度适配鸿蒙电脑的影像处理软件，仅用一个月完成核心功能开发，功能覆盖度达Windows平台的98%，带来更流畅的交互体验。美图展示了四大AI修图功能在鸿蒙电脑端的适配成果：AI消除、智能抠图、AI变清晰、无痕改字，修图效率与表现力双提升。鸿蒙电脑从内核层自主研发，助力软件深度优化。未来双方将围绕鸿蒙的智能图片处理能力展开联合创新，从"兼容适配"转向"联合共创"，共同拓展软件创新边界，推动鸿蒙应用规模化落地。

鸿蒙操作系统美图秀秀 AI修图

热文

3 天
7天

AI视野：Pika1.0首批用户资格揭晓；Runway官宣下场通用世界模型；妙鸭相机推出AI修图；抖音正式上线AI创作功能

荐AI日报：苹果AI国行版或随iOS 18.6月底上线；Suno v4.5正式上线；Runway发布图像一致性参考功能

京东Ai给妈妈写诗京东推出AI写诗功能

荐AI日报：Vidu Q1正式上线；MCP SDK 正式支持流式 HTTP；抖音一季度封禁AI黑产账号260万个

简单AI：零门槛AI修图！3分钟免费生成专业级春日写真，摄影师要慌了！

可灵AI发布全新2.0模型：上线多模态视频编辑功能

荐AI日报：OpenAI下周或发布GPT-4.1系列；Pika全新AI视频功能Twists；商汤科技日日新V6震撼发布

ChatGPT上线图库功能：可管理AI生成图片

荐AI日报：小米首个推理大模型开源Xiaomi MiMo；快手上线AI笔记工具“喵记多”；腾讯拆分AI团队

第十二届百度奖学金揭晓：半数攻坚大模型，AI解锁医疗、交通新场景

美图秀秀桌面版AI修图改图能力全面接入鸿蒙电脑，开启高效适配新范式

热文

特朗普准备撤回“AI芯片出口管制”……各国单独谈判

Anthropic推出Claude网络搜索API，押注“后谷歌时代”信息访问

谷歌在Pixel 9 Pro广告中，嘲讽iPhone 17：抄袭、老旧！

2025 年，SpaceX 发射了多少枚火箭？

不顾特朗普的阻挠，Uber继续全球扩张…携手土耳其及中国企

苹果高管称：10 年后，可能 iPhone 将不复存在！

今年第二次，亚马逊的 Zoox 召回 270 辆无人驾驶出租车

特朗普关税政策颠覆汽车行业，福特率先开启“涨价潮”！

每年多付1230亿美元？特朗普关税或将“掏空”美国人的钱包

苹果“为彼此创造”不再？听乔纳森·艾维忆往昔、谈传承

全网最大的“AI色情网站”MrDeepfakes宣布永久关闭

马斯克称地球会被太阳焚化，网友：有科学依据，但…

20周年纪念版iPhone迎来重大变革，全屏设计+屏下摄像头