首页 > 业界 > 关键词  > Pika最新资讯  > 正文

AI视野:Pika1.0首批用户资格揭晓;Runway官宣下场通用世界模型;妙鸭相机推出AI修图;抖音正式上线AI创作功能

2023-12-12 15:18 · 稿源:站长之家

📰🤖📢AI新鲜事

Pika1.0首批用户资格揭晓

Pika Labs最新视频生成产品Pika1.0引起轰动,已开始向候补名单用户发放使用资格。Pika1.0以文生成视频为特色,提供3秒视频快速生成、背景修改等功能。用户可在推特或邮箱确认是否成为首批体验者。

【AiBase提要】:

🚀 Pika1.0发布: Pika Labs推出视频生成工具Pika1.0,引起广泛关注。

📧 首批用户资格: Pika向部分候补用户发放体验资格,用户可查收确认邮件。

🎥 功能亮点: Pika1.0支持文生成视频,提供快速生成、背景修改等特色功能。

英伟达2023年投资了35家人工智能公司

英伟达在2023年大幅扩大对AI初创企业的投资,已投资35家公司,涵盖范围从大型新人工智能平台到小型初创企业,成为人工智能领域最活跃的投资者之一。

【AiBase提要:】

🚀 英伟达在2023年成为AI领域最活跃的投资者之一,投资35家公司,投资范围广泛。

💼 投资标准以技术相关性为主,注重与使用其技术、依赖其技术的公司建立紧密关系。

🌐 投资组合包括与OpenAI竞争对手Inflection AI和其他公司,强调对技术基础的依赖。

体育画报出版商发生AI丑闻后解雇CEO

著名杂志《体育画报》The Arena Group宣布,其董事会已终止了其首席执行官罗斯·莱文索恩的雇佣关系。

【AiBase提要:】

🔍 体育画报出版商解雇CEO罗斯·莱文索恩,公司曾发布由不存在的作家署名的人工智能生成文章,引起争议。

📰 揭露后,两名高管被解雇,公司高级副总裁宣布终止与莱文索恩的雇佣关系。

👥 新的临时CEO由多数投资者马诺吉·巴尔加接任,公司回应解雇与人工智能丑闻无关。

抖音正式上线AI创作功能 最新AI特效破6亿次播放

抖音最新推出AI创作功能,博主通过使用AI生成的漫画特效制作创意视频,受到热烈关注,标志着AI技术在短视频创作领域的广泛应用。

【AiBase提要:】

🎨 AI创作横空出世:抖音正式推出AI创作功能,博主们通过AI生成的漫画特效创作独特视频,引起用户极大兴趣。

🌐 热门特效引爆关注:博主运用AI漫画特效、古风形象生成等功能,视频播放次数突破6亿,展示AI技术在短视频创作中的威力。

🚀 AI赋能创意生态:引入AI绘画技术降低门槛,普通人也能轻松融入AI创作,预示着AI技术在创意领域将迎来更广泛应用。

抖音博主用AI生成春晚图 网友辣评:这是过春节还是过鬼节?

抖音知名博主通过AI技术创作了中式春晚图,但在指令发布后图像变幻莫测,引发网友热议,质疑图像中的怪异现象。

image.png

【AiBase提要:】

🎨 博主通过AI技术创作中式春晚图,呈现奇幻太空场景。

👻 指令发布后图像变化引发网友关注,出现怪异现象,疑似“春晚变鬼节”。

💬 网友热议中发现AI生成图像的局限性,同时推动更多人涉足AI领域。

Astra Starter Templates 集成 ZipWP AI 网站生成器

Astra Starter Templates 宣布与 ZipWP AI 网站构建器整合,用户可在60秒内创建完整网站,包括内容和图像。

Starter Templates3.5.2:全新基于 AI 的模板工具包库:

https://wpastra.com/changelog/version-3-5-2/

【AiBase提要】

🚀 模板整合AI构建器: Astra Starter Templates整合ZipWP AI构建器,提供280+可自定义网站模板,支持用户快速创建专业外观网站。

🤖 ZipWP AI构建器功能: ZipWP利用人工智能在60秒内创建完整WordPress网站,无需编码或技术知识,提供自动化设计和内容生成。

💼 灵活选择高级版: ZipWP提供免费和高级版,高级版每天可创建10个网站,价格为399美元/年,支持在开源WordPress环境中定制使用。

🤖📈💻💡大模型动态

李飞飞联袂谷歌推出视频生成模型W.A.L.T

谷歌与李飞飞的斯坦福团队联合推出基于Transformer的视频生成模型W.A.L.T,采用因果编码器和窗口注意的变压器架构,在图像和视频领域取得Gen-2水平的逼真效果。

image.png

论文地址:https://walt-video-diffusion.github.io/assets/W.A.L.T.pdf

【AiBase提要:】

🌟 W.A.L.T利用因果编码器和变压器架构将图像和视频压缩到共享潜在空间,实现了联合训练和生成,取得SOTA性能。

🚀 两个关键决策使W.A.L.T成功解决视频生成建模难题,采用潜在视频扩散模型,在多个基准测试上表现出色。

📄 W.A.L.T的突破性设计标志着视频生成进入新时代,为AI视频技术拓展发展空间,展示了Transformer的广泛适用性。

Runway官宣下场通用世界模型

Runway公司宣布发展通用世界模型(GWM),旨在解决AI视频领域的难题。该模型旨在模拟广泛和多样的真实世界情景,提高视频生成系统的理解和逼真度。公司表示将面临许多研究挑战,招募团队应对。

【AiBase提要】:

🌐 Runway宣布开发通用世界模型(GWM)解决视频AI难题。

🤖 GWM旨在模拟真实世界情景,提高视频生成系统逼真度。

🚀 公司面临挑战,招募团队应对,迎接人工智能视频新时代。

阿里推出东南亚专用AI大语言模型SeaLLM

阿里研究部门发布SeaLLM,首个专为东南亚市场设计的大语言模型,在语言和安全任务上表现优异,突显阿里对该地区增长市场的重视。

【AiBase提要:】

🚀 阿里推出首个专为东南亚市场设计的SeaLLM,展现在该地区的市场拓展雄心。

🌐 SeaLLM在语言和安全任务方面优于其他开源模型,经过越南语、印尼语等八种语言数据集的预训练。

🔗 SeaLLM的性能超越其他大型语言模型,尤其在非拉丁语系任务和英语与低资源语言翻译方面取得显著成果。

Meta AI开源T2V模型AVID 可修复视频改变纹理

Meta AI最近开源的T2V模型AVID具备先进的修复和扩展能力,通过文本编辑视频,支持修复视频、更改对象、改变纹理和颜色,甚至删除或替换视频内容。

image.png

项目地址:https://zhang-zx.github.io/AVID/

【AiBase提要:】

🔧 先进修复与扩展能力: Meta AI的AVID模型开源,具备先进的运动模块和可调节的结构引导,能有效修复和扩展视频,处理不同修复类型且质量高。

🔄 时间一致性与可变长度处理: AVID解决文本引导视频修复的挑战,引入新颖的时间多重扩散采样管道,具备中帧注意力引导机制,可稳健处理不同视频持续时间范围。

👩‍💻 培训阶段方法: 在培训阶段,AVID模型采用两步方法,集成运动模块和优化视频数据,保留UNet参数并专门训练结构指导模块,推理过程中构建连续帧片段并计算结果。

🤖📱💼AI应用

妙鸭相机推出AI修图

妙鸭相机的新AI修图功能引起关注,通过数字分身和大模型算法实现智能修脸,挑战美图秀秀等传统修图软件在美颜市场的地位。

【AiBase提要】

🚀 技术创新: 妙鸭相机推出基于大模型的“AI修脸”,以智能、快速的修图体验刷新用户对美图软件的认知。

📸 功能强大: 用户通过上传照片生成数字分身,可选择不同修脸模式,包括焕新和重塑,实现个性化、智能的修图效果。

🌐 市场竞争: 妙鸭相机的AI修图功能挑战传统美图软件,预示着修图美颜市场将迎来激烈的用户争夺战。

Google发布编程工具AlphaCode2

谷歌发布了由Gemini模型提升的AlphaCode2,是一款AI编程工具,在编程竞赛中以Python、Java、C++和Go等多语言表现优异,通过复杂技术解决了原AlphaCode的局限。

【AiBase提要:】

🚀 性能提升: AlphaCode2由Gemini模型驱动,在编程竞赛中表现显著优于前代,击败约85%竞争对手。

💻 多语言支持: 该工具在Python、Java、C++和Go等多语言中表现卓越,展现了强大的编程能力。

🔍 复杂问题解决: 利用动态规划等复杂技术,AlphaCode2能理解涉及“复杂”数学和理论计算机科学的编程挑战,解决了原版无法应对的问题。

AI绘图产品Visual Electric图片质量可媲美Adobe Firefly

Visual Electric是一个为创意过程打造的图像生成器,它拥有一个令人惊叹的图像库和相应的提示,可以激发灵感。它可以通过迭代来发展创意,尝试不同的风格和颜色。

QQ截图20231211165707.jpg

体验地址:https://visualelectric.com/

【AiBase提要:】

🎨 创意激发: Visual Electric为创意工作者提供强大的图像生成能力,通过简单输入提示即可生成高质量图像。

🖌️ 直观创作空间: 白板式界面让用户清晰看到生成过程,可随时编辑和处理图像,集成了抠图等便捷功能。

🌈 多样风格选择: 提供精心打造的多种风格,让用户轻松尝试不同创意可能性,实现直观而多样的创作。

👨‍💻💡🎯聚焦开发者

阿里推视频生成框架DreaMovin

DreaMoving是阿里基于扩散模型的视频生成框架,通过图文输入可定制高质量人类舞蹈视频。框架包含Video ControlNet和Content Guider两大组件,实现运动控制和身份保留。通过姿势序列和简单描述,如文本和图像,DreaMoving生成高保真度视频。

image.png

项目网址:https://dreamoving.github.io/dreamoving/

【AiBase提要:】

🌐 框架介绍: DreaMoving是基于扩散模型的视频生成框架,可通过图文输入生成高质量舞蹈视频。

🔄 架构解析: Video ControlNet和Content Guider是关键组件,分别实现运动控制和身份保留,适用于不同风格的扩散模型。

🎬 成果展示: DreaMoving通过姿势序列和简单描述生成高保真度的定制视频,实现身份控制和外观控制。

UCLA推出Chameleon框架,大模型表格数学推理准确率达98.78%

由UCLA等机构推出的Chameleon框架通过多工具融合,包括LLMs、视觉模型、搜索引擎等,解决大型语言模型在实时信息获取和数学推理上的不足,在表格数学推理任务上达到98.78%准确率。

image.png

项目地址:https://chameleon-llm.github.io/

【AiBase提要:】

🦎 多工具融合: Chameleon框架融合LLMs、视觉模型、搜索引擎等多种工具,弥补大型语言模型在实时信息获取和数学推理方面的不足。

📊 表格数学推理准确率: Chameleon在表格数学推理任务中表现优异,准确率高达98.78%,超越现有模型,核心在于LLM规划器生成自然语言程序。

🌐 灵感来源: Chameleon模型灵感来源于变色龙,象征大型语言模型在执行外部工具组合推理任务时的多功能性和适应性,在学术界和开发者社区受到广泛关注。

举报

  • 相关推荐
  • AI日报:Runway发布新视频模型Gen-4;宇树G1直播5分钟带货破百万;OpenAI将开源新模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Runway惊艳发布AI视频生成模型Gen-4,角色场景一致性强到离谱Runway最近推出的Gen-4人工智能模型在媒体生成领域引起了广泛关注。尽管X在过去经历了波动,但近期因与GrokAI的整合和利润率改善逐渐回暖,用户也在回流。

  • AI日报:阿里新模型Qwen3即将来袭;GitHub开源MCP服务器;Runway发布Gen-4 Turbo

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Qwen3即将来袭:阿里云新模型相关支持已正式合并至vLLM代码库阿里云的Qwen3模型即将发布,标志着其在AI领域的又一重要进展。新推出的AI听歌报告能够精准识别用户音乐偏好,场景

  • 抖音回应上线辟谣卡功能:人工+AI提升处理效率

    快科技4月9日消息,日前,抖音黑板报发布关于上线辟谣卡”等治理不实信息新功能的公告。为了更快识别与处置不实信息,更全面向用户展示不实信息的起源、传播原因和事实真相,抖音正式上线针对不实信息进行研判、处置与展示的辟谣卡”新功能。抖音表示,一方面,新功能基于抖音联网大模型能力,综合多方信源,对平台上出现的疑似谣言信息进行实时搜索、运算和分

  • AI日报:Vidu Q1正式上线;MCP SDK 正式支持流式 HTTP抖音一季度封禁AI黑产账号260万个

    本文介绍了AI领域多项重要进展:1)MCP SDK支持流式HTTP协议,提升开发效率;2)Vidu Q1视频生成模型上线,提供专业级视觉体验;3)马斯克计划筹资250亿美元开发Colossus 2超级计算机;4)Sand AI开源MAGI-1视频生成模型;5)电商AI助手Add To Cart AI优化购物体验;6)Anthropic发布Claude Code编程指南;7)真我推出支持32种语言的AI翻译耳机;8)2025年AI视频企业TOP20榜单发布;9)清华GLM大模型免费开放;10)AI面试作弊工具引争议;11)抖音AI治理封禁260万违规账号;12)全球首款具备嗅觉的机器人问世。这些创新展示了AI技术在视频生成、编程辅助、电商、翻译等领域的快速发展与应用潜力。

  • 简单AI:零门槛AI修图!3分钟免费生成专业级春日写真,摄影师要慌了!

    春天看什么展?看人类花枝招“展”!四月的阳光、樱花、露营趴......拍照三件套搞起来!本工具人亲测了一款零门槛、超简单、巨好用的 AI 神器——搜狐简单 AI,从拍照到文案一站式搞定,全程不用下载,微信搜搜就能用哦~一、智能修图:路人消失术/背景替换满心期待拍出绝美的“春日花海大片”,但碰上阴天让鲜花都看起来灰突突的!还有乱入的路人甲乙丙丁和满地的�

  • 支报名团队探秘:《武侠世界AI》加入“数龙杯”

    “数龙杯”的第一个参赛者来了!在4月2日“数龙杯”全球AI游戏及应用创新大赛正式启动后,来自中国广州的“四方格团队”即投递了作品,成为首支报名成功的开发团队。大赛主办方也将继续跟踪报道各类创新团队,为他们创造更多的亮相机会,以此推动更多的创新项目与广大用户见面。

  • 可灵AI发布全新2.0模型上线多模态视频编辑功能

    快科技4月16日消息,据报道,可灵AI在北京举行灵感成真”2.0模型发布会,正式发布可灵2.0视频生成模型及可图2.0图像生成模型。据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日,全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模

  • 第 一年轻人已经用AI创业了,AI应用师成新型职业

    “比如我要做一个特效场景,以前需要3D建模搭一个景,现在一句话输入进去,AI马上就能生成。”温维斯接受记者采访时说,他已经把AI当成一项事业,正式用可灵AI开始创业了。随着技术加速迭代以及算力成本不断下降,视频大模型技术应用的门槛和成本将实现“双降”,进将带动国产视频大模型规模化使用。

  • AI日报:OpenAI下周或发布GPT-4.1系列;Pika全新AI视频功能Twists;商汤科技日日新V6震撼发布

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、报道称OpenAI下周重磅发布GPT-4.1系列,包含Mini版和Nano版OpenAI即将发布GPT-4.1系列及o3系列,标志着其在多模态和推理能力上的重大进展。新加坡在AI技能学习上投入的时间显著高于其他亚太国家,显示出其在AI人才培养方面的竞争力。

  • ChatGPT上线图库功能:可管理AI生成图

    快科技4月16日消息,据报道,OpenAI近日宣布将为ChatGPT推出全新的Image Library图库功能,该功能将帮助用户更高效地管理和查看AI生成的图像。这项创新功能将逐步向所有用户开放,包括移动端和网页端的免费版、Plus版及Pro版用户。新功能的设计充分考虑了用户体验的便捷性。用户只需点击ChatGPT侧边栏的Library入口,就能进入一个直观的图像网格界面。在这个界面中,用户可以轻�