AI视野：Pika1.0正式向所有人开放；阿里开源文生3D模型；Midjourney V6涉嫌侵权；谷歌推出新AI SDK

2023-12-26 15:22 · 稿源：站长之家

新鲜AI产品点击了解：https://top.aibase.com/

🤖📱💼AI应用

Pika1.0正式向所有人开放

Pika1.0官方宣布正式向所有人开放网页版本试用资格，每个用户都可免费体验该创意视频制作平台。该版本以文生成视频为特色，提供3秒视频快速生成和背景修改等功能，尤其擅长动漫风格的动物生成。虽然部分用户反映生成效果与宣传有差距，但阶段性免费使用提供机会。

【AiBase提要:】
😊 Pika1.0正式开放网页版试用，允许每个用户免费体验。
😎 以文生成视频为特色，提供3秒视频快速生成和背景修改等功能。
👍 特长于生成动漫风格的动物，用户可轻松体验宫崎骏画风。

LeonardoAI视频生成功能正式向所有用户推出

LeonardoAI图像生成工具推出视频生成功能，基于SVD技术，免费试用，上周获3100万美元融资，用户数量已达700万。

QQ截图20231225161813.png

官网地址:https://top.aibase.com/tool/leonardo-ai

【AiBase提要:】
🚀 LeonardoAI图像生成工具发布视频生成功能，基于SVD技术，效果优于Runway，但仅支持使用内部工具生成的图片生成视频。
💰 上周LeonardoAI获3100万美元融资，投资方包括Blackbird、Side Stage Ventures等。
👥 LeonardoAI用户数量已达700万，总生成图像超过7亿张，服务创意行业如游戏、广告、时尚和建筑。

🤖📈💻💡大模型动态

阿里开源文生3D模型

阿里通义实验室的XR实验室开源了文生3D新模型，能通过文本描述生成对应的3D模型及纹理，包括Text-to-ND和Text-to-ND-MV两个大模型。为满足不同需求，开源了基础版本和Multi-View版本，并提供了优化代码，实现文本直接到3D模型的生成。

微信截图_20231226082207.png

Text-to-ND、Text-to-ND-MV大模型:

https://modelscope.cn/models/Damo_XR_Lab/Normal-Depth-Diffusion-Model/summary

【AiBase提要:】
🌐 多模型开源: 阿里通义XR实验室发布Text-to-ND和Text-to-ND-MV两大3D模型，满足不同算法开发需求。
🛠️ 开发者支持: 提供基础版本和Multi-View版本，以及优化代码，方便开发者生成文本描述对应的3D模型。
🔗 模型链接: 可通过链接获取Text-to-ND和Text-to-ND-MV大模型，促进3D模型生成技术的应用。

天工SkyAgents正式开放测试

昆仑万维推出基于「天工大模型」的AI Agents开发平台「天工SkyAgents」，支持用户通过自然语言构建私人助理，实现模块化任务执行，推动大模型技术普及。

微信截图_20231225161544.png

【AiBase提要:】
🚀 技术基础: 「天工 SkyAgents」基于昆仑万维的「天工大模型」，具备自主学习和独立思考能力。
🤖 任务模块化: 用户可通过自然语言构建私人助理，将不同任务模块化，实现执行各种任务。
🌐 推动普及化: 平台推动大模型技术普及，助力个人和中小企业积极拥抱先进的AI技术。

Cyanpuppets1.5本周五发布

Cyanpuppets的最新版本1.50将于本周五发布，采用迄今最大的训练数据集和最通用的算法模型，允许用户仅用两个网络摄像头实时快速创建3D舞蹈内容。

地址:https://cyanpuppets.myshopify.com/

【AiBase提要】
🚀 创新功能: Cyanpuppets1.5版本采用最大的训练数据集和通用算法，用户可轻松实时创建3D舞蹈内容。
💡 技术核心: Cyanpuppets公司以卷积神经网络和深度神经网络为核心，结合NVIDIA GPU算力，实现2D视频生成3D动作数据。
🌐 公司背景: Cyanpuppets的公司青色木偶科技是国内领先的人工智能图像算法技术和实时渲染平台工具提供商。

📰🤖📢AI新鲜事

Midjourney最新V6版本涉嫌版权侵权引发争议

Midjourney最新V6版本的文本生成器被指涉嫌版权侵权，用户测试发现生成的图像与多部电影场景高度相似，引起艺术家抱怨并遭到封禁。

【AiBase提要】
🔍 Midjourney最新V6版本升级，用户抱怨生成图像过于相似于受版权保护的艺术品。
🎨 艺术家测试发现生成的图像几乎与多部电影场景一模一样，遭到封禁。
🤖 AI研究者Gary Marcus关注指控，公司未回应是否使用高分辨率版权图像进行训练。

戴尔携手AMD扩大生成式人工智能产品线

戴尔宣布推出搭载AMD Instinct MI300X AI加速器的高性能计算服务器，与Nvidia竞争，强调多元选择、开放标准，并发布"Dell Validated Design for Generative AI"标准。

【AiBase提要:】
🔄 多元选择: 戴尔推出PowerEdge XE9680服务器，搭载AMD Instinct MI300X AI加速器，与Nvidia版本齐头并进，为客户提供更多人工智能工作负载选择。
🌐 开放标准: 戴尔加入Ultra Ethernet Consortium，与Nvidia不同，倡导开放计算、互操作性，推动采用基于标准的网络。
💻 新标准推出: 戴尔发布"Dell Validated Design for Generative AI with AMD"标准，为企业提供硬件和网络架构框架，支持大型语言模型（LLMs）的运行。

AI技术可鉴定奢侈品真伪，准确率达到99.1%

科技公司Entrupy宣称其AI技术能以99.1%的准确率检测二手奢侈品真伪，通过智能手机插入硬件设备拍摄照片，并与数百万真品库存图片进行比对。

【AiBase提要】:
🤖 Entrupy的AI设备可几乎完美地检测二手奢侈品真伪，尤其对品牌如路易威登和香奈儿的产品，准确率达99.1%。
📸 使用AI鉴定器，用户需将智能手机插入Entrupy硬件设备，从各个角度拍摄产品照片，通过微型镜头进行细节鉴定。
🌐 此AI技术引起广泛关注，尤其是在TikTok与Entrupy合作，用于鉴别TikTok Shop上的产品真伪，加强奢侈品转售商与消费者的信任。

英国法官可以用ChatGPT写裁决书了

英国法官可使用ChatGPT起草法律裁决书，相关官方指南详细规定正确使用方法、潜在风险及示例，标志着司法领域对生成式AI的认可。

【AiBase提要:】
📜 法官使用指南发布: 英国允许法官使用ChatGPT起草法律裁决书，并发布详细指南，适用于司法机构的官员、员工。
🚨 潜在风险与注意事项: 指南强调使用ChatGPT等生成式AI需谨慎，警告可能存在的不准确性和局限性，提醒法官避免过度依赖公共生成式AI产品。
🌐 司法认可与未来展望: 此举标志着司法领域对生成式AI的认可，未来将继续完善相关指南，以促进正确、负责任的AI使用。

谷歌推出新AI SDK

近日发布了其新的 Google AI SDK，旨在简化在安卓应用中集成其迄今为止表现最佳的模型Gemini Pro。使用此 SDK，开发者无需构建和管理自己的后端基础设施。

【AiBase提要:】
🚀 Google发布新的AI SDK，简化在安卓应用中集成表现最佳的Gemini Pro模型，支持广泛的文本和图像推理任务。
🔄 Google AI SDK使开发者无需构建和管理后端基础设施，提供安卓应用的客户端SDK，包装Gemini REST API为惯用的Kotlin API。
💡除了Gemini Pro，Google还推出较小的模型Gemini Nano，可在设备端运行，通过AICore简化在安卓应用中集成AI。

印度将建立人工智能气候模型

印度气象部门计划引入人工智能技术建立气候模型，以提高严重天气事件的预测准确性，减少损失和风险。

【AiBase提要:】
🌐 技术引入: 印度气象部门将利用人工智能技术建立气候模型，提供更高质量、更便宜的天气数据。
🌀 事件预测: 人工智能气候模型通过机器学习和大数据分析，能够提前识别和分析气象数据中的模式，帮助预测暴雨、洪水等严重天气事件。
🚀 科技发展: 这一举措将推动印度在气象领域的科技发展，提升国家的灾害应对能力，为公众和政府提供更准确可靠的天气预报和警报。

Infosys 宣布终止价值15亿美元的全球客户人工智能技术合同

Infosys宣布终止价值15亿美元的全球客户人工智能技术合同，未透露客户细节和终止原因，这对业务和员工可能产生深远影响。

【AiBase提要:】
🔍 Infosys宣布终止15亿美元全球客户AI合同。
💼 交易预计每年为Infosys带来1亿美元收入，为期15年。
💔 终止可能在当前市场不确定性下对业务和人员造成影响。

👨‍💻💡🎯聚焦开发者

南洋理工开源Upscale-A-Video

新加坡南洋理工大学的Upscale-A-Video框架通过文本提示、时序U-Net和循环潜码等创新方法，解决大模型生成视频中的不连贯、模糊、掉帧等问题，提供高质量视频超分辨率。

【AiBase提要】
🎥 Upscale-A-Video框架解决大模型生成视频的问题，融合文本提示、时序U-Net和循环潜码，提供超分辨率、去噪、还原等功能。
🌐 通过扩散方法，局部和全局两种策略维持时间一致性，保证长视频整体连贯性。
👾 文本提示可指导细节纹理生成，时序U-Net和循环潜码模块共同优化视频质量，实验证明在峰值信噪比和感知损失上优势明显。

论文地址:https://arxiv.org/abs/2312.06640

开源地址:https://github.com/sczhou/Upscale-A-Video

项目地址:https://shangchenzhou.com/projects/upscale-a-video/

（举报）

相关推荐

关键词：

Pika1.0

荐AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

本期AI日报聚焦多项AI领域重要进展：1) Midjourney推出首款视频生成模型V1，支持21秒视频生成；2) OpenAI CEO确认GPT-5将于今夏发布；3) Google上线语音对话搜索功能Search Live；4) OpenAI开源客户服务代理框架；5) MiniMax发布智能代理Agent；6) 恶意工具WormGPT出现新变种；7) OpenAI推出企业版ChatGPT折扣；8) DeepSite V2支持3D网页动画生成；9) AI工具可秒变PPT；10) 比亚迪与字节跳动合作开发动力电池技术；11) 马斯克否认xAI巨额亏损传闻。

AI日报 Midjourney 视频生成模型
荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

本文介绍了AI领域多项重要进展：1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen，显著提升建模效率；2)阿里发布多模态大模型HumanOmniV2，准确率达69.33%；3)钉钉AI表格实现1小时处理千项任务；4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级；5)微软推出Deep Research智能体，自动化研究流程；6)香港理工与OPPO联合开源视频超清框架DLoRAL；7)谷歌开源MCP工具箱简化AI与数据库集成；8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。
荐AI日报：阿里开源3D数字人项目MNN TaoAvatar；MiniMax Agent上线；罗永浩数字人直播再探“AI+IP”带货模式

本文汇总了AI领域最新动态：1）阿里开源MNN+TaoAvatar技术，实现手机端3D数字人实时交互；2）MiniMax升级AI工具Agent，新增智能图像搜索和多语言支持；3）罗永浩数字人将登陆百度电商直播；4）OpenAI员工套现近30亿美元，软银成最大接盘方；5）ChatGPT推出深度研究和语音模式升级；6）Meta发布V-JEPA2模型，提升机器人环境适应能力；7）AMD与OpenAI合作推出新一代AI芯片；8）Google Gemini集成Imagen4图像生成模型；9）谷歌AI实现10公里级精准天气预报；10）Gartner预测到2028年80%的AI应用开发时间将缩短50%。

人工智能虚拟现实 3D数字人
荐AI日报：腾讯混元3D 2.1大模型开源；字节跳动AI Lab负责人李航卸任；OpenAI Codex 全新升级

本文介绍了AI领域最新动态：1)腾讯开源混元3D2.1大模型，提升3D生成质量；2)OpenAI Codex升级，优化代码生成功能；3)字节跳动AI Lab负责人李航卸任；4)微软发布700个AI应用案例；5)微软推出Code Researcher工具，解决58%系统崩溃问题；6)Observer AI实现屏幕操作自动化；7)Genspark发布AI浏览器；8)麻省理工用AI技术3.5小时修复15世纪名画；9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni；10)MagicTryOn视频换衣框架；11)字节跳动发布实时互动AI视频生成模型Seaweed APT2；12)ChatGPT搜索功能升级；13)字节跳动与老凤祥合作开发AI智能眼镜。

人工智能 3D生成开源大模型
荐A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

AI日报栏目汇总了近期AI领域的重要进展：1)字节跳动开源EX-4D框架，可将单目视频转换为多视角4D视频；2)B站开源动漫视频生成模型AniSora V3，支持多种风格；3)DeepSWE+开源基于Qwen3-32B的AI Agent系统；4)字节开源3亿参数图像编辑模型VINCIE-3B；5)Stability AI推出移动端音频生成模型Stable Audio Open Small；6)谷歌发布免费教育AI工具套件Gemini for Education；7)Topview推出革命性AI数字人带货技术Avatar

人工智能 AI技术趋势 4D视频生成
谷歌推出终端AI编程工具Gemini CLI Gemini CLI安装使用教程一览

近日，谷歌在AI编程领域推出了一款备受瞩目的终端AI编程工具——Gemini CLI。这款免费开源的工具一经发布，便在开发者群体中引发了广泛关注，其强大的功能和免费开源的特性，使其在众多同类产品中脱颖而出，甚至让一些竞争对手如Claude Code相形见绌。如果您对AI编程工具感兴趣，想要了解更多类似的产品，可以访问 [AIbase - 智能匹配最适合您的AI产品和网站]（https://top.aiba

Gemini CLI AI编程工具
女子连续一周被邻居冒用地址点外卖专家提醒：可能侵权

近日，上海一名女子通过网络平台发帖，公开了自己连续一周被邻居冒用住址订购外卖的离奇遭遇，事件迅速引发社会关注。据当事人李女士（化名）描述，自6月底起，她频繁发现家门口出现非本人订购的外卖，起初以为是配送错误，未予深究。然而，当类似情况持续一周，且监控画面显示邻居曾主动拦截送至其门前的外卖时，李女士意识到问题严重性。监控录像显示，�
荐AI日报：阿里通义开源音频生成模型ThinkSound；谷歌Veo3支态图片生成视频；昆仑万维发布 Skywork-R1V 3.0

【AI日报】今日AI领域重要动态：1)阿里开源支持链式推理的音频生成模型ThinkSound，实现高保真空间音频生成；2)谷歌Veo3升级，支持静态图片生成生动视频；3)Hugging Face发布30亿参数小模型SmolLM3，性能优于Llama-3.2-3B；4)阿里开源网络智能体WebSailor，展现强大推理和检索能力；5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5；6)Vidu Q1支持最多七张参考图像生成一致性视频；7)苹果�

人工智能音频生成链式推理
荐AI日报：MiniMax-M1开源；阿里Qwen3升级版适配苹果MLX架构；月之暗面发布新模型Kimi-Dev-72B

《AI日报》汇总了近期AI领域多项重要进展：1)月之暗面推出开源编程模型Kimi-Dev-72B，在软件工程任务测试中创下新纪录；2)MiniMax开源M1模型，支持超长上下文推理且训练成本低；3)腾讯发布AI音乐模型LeVo，支持音色克隆和分轨生成；4)阿里云Qwen3升级版适配苹果MLX架构；5)豆包推出"AI播客"功能，可将PDF转为对话播客；6)夸克App上线个性化AI家教"夸克老师"；7)松下发布多模态大模型OmniFlow，实现文本/图像/音频自由切换；8)TikTok推出三款AI视频创作工具；9)极氪与火山引擎合作，将豆包大模型接入智能座舱系统；10)Meta的Llama3.1模型在文本记忆方面表现突出；11)Grok上线定时追踪X热门话题功能；12)Gemini2.5Pro即将更新Deep Think功能；13)谷歌地图引入AI技术升级导航和个性化推荐功能。

人工智能开源模型软件工程
在AI、反垄断等多重压力下，谷歌推“员工自愿离职计划”，大范围裁员

谷歌在试图削减成本的同时，刻意避免大规模裁员，以防进一步打击员工士气或引来更多来自立法者和监管机构的审视……

谷歌裁员谷歌大范围裁员谷歌反垄断调查

热文

3 天
7天

AI视野：Pika1.0正式向所有人开放；阿里开源文生3D模型；Midjourney V6涉嫌侵权；谷歌推出新AI SDK

荐AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

荐AI日报：阿里开源3D数字人项目MNN TaoAvatar；MiniMax Agent上线；罗永浩数字人直播再探“AI+IP”带货模式

荐AI日报：腾讯混元3D 2.1大模型开源；字节跳动AI Lab负责人李航卸任；OpenAI Codex 全新升级

荐A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

谷歌推出终端AI编程工具Gemini CLI Gemini CLI安装使用教程一览

女子连续一周被邻居冒用地址点外卖专家提醒：可能侵权

荐AI日报：阿里通义开源音频生成模型ThinkSound；谷歌Veo3支态图片生成视频；昆仑万维发布 Skywork-R1V 3.0

荐AI日报：MiniMax-M1开源；阿里Qwen3升级版适配苹果MLX架构；月之暗面发布新模型Kimi-Dev-72B

在AI、反垄断等多重压力下，谷歌推“员工自愿离职计划”，大范围裁员

热文

AI日报：xAI 震撼发布Grok4；微软开源全新Phi-4-mini版本；上海

比特币首触112000美元：盘中涨幅最高达3%

微信：持续打击非法使用外挂行为进一步强化外挂营销信息治理

荣耀X70支持IP66/IP68/IP69/IP69K 号称行业最高规格防水

REDMI Turbo 4 Pro粉金新配色发布售价1899元起

小米回应小折叠未搭载玄戒O1：立项之初总量比较有限

三星Galaxy Z Flip7发布：7999元起首发Exynos 2500

小米汽车交付超30万辆：用时仅15个月

淘宝闪购日订单突破8000万日活超2亿

罗马仕深夜正式发布停工停产通知：宣布停工停产半年

王化辟谣小米与徕卡终止合作：无聊还是胡说