首页 > 业界 > 关键词  > Pika最新资讯  > 正文

AI视野:Pika1.0首批用户资格揭晓;Runway官宣下场通用世界模型;妙鸭相机推出AI修图;抖音正式上线AI创作功能

2023-12-12 15:18 · 稿源:站长之家

📰🤖📢AI新鲜事

Pika1.0首批用户资格揭晓

Pika Labs最新视频生成产品Pika1.0引起轰动,已开始向候补名单用户发放使用资格。Pika1.0以文生成视频为特色,提供3秒视频快速生成、背景修改等功能。用户可在推特或邮箱确认是否成为首批体验者。

【AiBase提要】:

🚀 Pika1.0发布: Pika Labs推出视频生成工具Pika1.0,引起广泛关注。

📧 首批用户资格: Pika向部分候补用户发放体验资格,用户可查收确认邮件。

🎥 功能亮点: Pika1.0支持文生成视频,提供快速生成、背景修改等特色功能。

英伟达2023年投资了35家人工智能公司

英伟达在2023年大幅扩大对AI初创企业的投资,已投资35家公司,涵盖范围从大型新人工智能平台到小型初创企业,成为人工智能领域最活跃的投资者之一。

【AiBase提要:】

🚀 英伟达在2023年成为AI领域最活跃的投资者之一,投资35家公司,投资范围广泛。

💼 投资标准以技术相关性为主,注重与使用其技术、依赖其技术的公司建立紧密关系。

🌐 投资组合包括与OpenAI竞争对手Inflection AI和其他公司,强调对技术基础的依赖。

体育画报出版商发生AI丑闻后解雇CEO

著名杂志《体育画报》The Arena Group宣布,其董事会已终止了其首席执行官罗斯·莱文索恩的雇佣关系。

【AiBase提要:】

🔍 体育画报出版商解雇CEO罗斯·莱文索恩,公司曾发布由不存在的作家署名的人工智能生成文章,引起争议。

📰 揭露后,两名高管被解雇,公司高级副总裁宣布终止与莱文索恩的雇佣关系。

👥 新的临时CEO由多数投资者马诺吉·巴尔加接任,公司回应解雇与人工智能丑闻无关。

抖音正式上线AI创作功能 最新AI特效破6亿次播放

抖音最新推出AI创作功能,博主通过使用AI生成的漫画特效制作创意视频,受到热烈关注,标志着AI技术在短视频创作领域的广泛应用。

【AiBase提要:】

🎨 AI创作横空出世:抖音正式推出AI创作功能,博主们通过AI生成的漫画特效创作独特视频,引起用户极大兴趣。

🌐 热门特效引爆关注:博主运用AI漫画特效、古风形象生成等功能,视频播放次数突破6亿,展示AI技术在短视频创作中的威力。

🚀 AI赋能创意生态:引入AI绘画技术降低门槛,普通人也能轻松融入AI创作,预示着AI技术在创意领域将迎来更广泛应用。

抖音博主用AI生成春晚图 网友辣评:这是过春节还是过鬼节?

抖音知名博主通过AI技术创作了中式春晚图,但在指令发布后图像变幻莫测,引发网友热议,质疑图像中的怪异现象。

image.png

【AiBase提要:】

🎨 博主通过AI技术创作中式春晚图,呈现奇幻太空场景。

👻 指令发布后图像变化引发网友关注,出现怪异现象,疑似“春晚变鬼节”。

💬 网友热议中发现AI生成图像的局限性,同时推动更多人涉足AI领域。

Astra Starter Templates 集成 ZipWP AI 网站生成器

Astra Starter Templates 宣布与 ZipWP AI 网站构建器整合,用户可在60秒内创建完整网站,包括内容和图像。

Starter Templates3.5.2:全新基于 AI 的模板工具包库:

https://wpastra.com/changelog/version-3-5-2/

【AiBase提要】

🚀 模板整合AI构建器: Astra Starter Templates整合ZipWP AI构建器,提供280+可自定义网站模板,支持用户快速创建专业外观网站。

🤖 ZipWP AI构建器功能: ZipWP利用人工智能在60秒内创建完整WordPress网站,无需编码或技术知识,提供自动化设计和内容生成。

💼 灵活选择高级版: ZipWP提供免费和高级版,高级版每天可创建10个网站,价格为399美元/年,支持在开源WordPress环境中定制使用。

🤖📈💻💡大模型动态

李飞飞联袂谷歌推出视频生成模型W.A.L.T

谷歌与李飞飞的斯坦福团队联合推出基于Transformer的视频生成模型W.A.L.T,采用因果编码器和窗口注意的变压器架构,在图像和视频领域取得Gen-2水平的逼真效果。

image.png

论文地址:https://walt-video-diffusion.github.io/assets/W.A.L.T.pdf

【AiBase提要:】

🌟 W.A.L.T利用因果编码器和变压器架构将图像和视频压缩到共享潜在空间,实现了联合训练和生成,取得SOTA性能。

🚀 两个关键决策使W.A.L.T成功解决视频生成建模难题,采用潜在视频扩散模型,在多个基准测试上表现出色。

📄 W.A.L.T的突破性设计标志着视频生成进入新时代,为AI视频技术拓展发展空间,展示了Transformer的广泛适用性。

Runway官宣下场通用世界模型

Runway公司宣布发展通用世界模型(GWM),旨在解决AI视频领域的难题。该模型旨在模拟广泛和多样的真实世界情景,提高视频生成系统的理解和逼真度。公司表示将面临许多研究挑战,招募团队应对。

【AiBase提要】:

🌐 Runway宣布开发通用世界模型(GWM)解决视频AI难题。

🤖 GWM旨在模拟真实世界情景,提高视频生成系统逼真度。

🚀 公司面临挑战,招募团队应对,迎接人工智能视频新时代。

阿里推出东南亚专用AI大语言模型SeaLLM

阿里研究部门发布SeaLLM,首个专为东南亚市场设计的大语言模型,在语言和安全任务上表现优异,突显阿里对该地区增长市场的重视。

【AiBase提要:】

🚀 阿里推出首个专为东南亚市场设计的SeaLLM,展现在该地区的市场拓展雄心。

🌐 SeaLLM在语言和安全任务方面优于其他开源模型,经过越南语、印尼语等八种语言数据集的预训练。

🔗 SeaLLM的性能超越其他大型语言模型,尤其在非拉丁语系任务和英语与低资源语言翻译方面取得显著成果。

Meta AI开源T2V模型AVID 可修复视频改变纹理

Meta AI最近开源的T2V模型AVID具备先进的修复和扩展能力,通过文本编辑视频,支持修复视频、更改对象、改变纹理和颜色,甚至删除或替换视频内容。

image.png

项目地址:https://zhang-zx.github.io/AVID/

【AiBase提要:】

🔧 先进修复与扩展能力: Meta AI的AVID模型开源,具备先进的运动模块和可调节的结构引导,能有效修复和扩展视频,处理不同修复类型且质量高。

🔄 时间一致性与可变长度处理: AVID解决文本引导视频修复的挑战,引入新颖的时间多重扩散采样管道,具备中帧注意力引导机制,可稳健处理不同视频持续时间范围。

👩‍💻 培训阶段方法: 在培训阶段,AVID模型采用两步方法,集成运动模块和优化视频数据,保留UNet参数并专门训练结构指导模块,推理过程中构建连续帧片段并计算结果。

🤖📱💼AI应用

妙鸭相机推出AI修图

妙鸭相机的新AI修图功能引起关注,通过数字分身和大模型算法实现智能修脸,挑战美图秀秀等传统修图软件在美颜市场的地位。

【AiBase提要】

🚀 技术创新: 妙鸭相机推出基于大模型的“AI修脸”,以智能、快速的修图体验刷新用户对美图软件的认知。

📸 功能强大: 用户通过上传照片生成数字分身,可选择不同修脸模式,包括焕新和重塑,实现个性化、智能的修图效果。

🌐 市场竞争: 妙鸭相机的AI修图功能挑战传统美图软件,预示着修图美颜市场将迎来激烈的用户争夺战。

Google发布编程工具AlphaCode2

谷歌发布了由Gemini模型提升的AlphaCode2,是一款AI编程工具,在编程竞赛中以Python、Java、C++和Go等多语言表现优异,通过复杂技术解决了原AlphaCode的局限。

【AiBase提要:】

🚀 性能提升: AlphaCode2由Gemini模型驱动,在编程竞赛中表现显著优于前代,击败约85%竞争对手。

💻 多语言支持: 该工具在Python、Java、C++和Go等多语言中表现卓越,展现了强大的编程能力。

🔍 复杂问题解决: 利用动态规划等复杂技术,AlphaCode2能理解涉及“复杂”数学和理论计算机科学的编程挑战,解决了原版无法应对的问题。

AI绘图产品Visual Electric图片质量可媲美Adobe Firefly

Visual Electric是一个为创意过程打造的图像生成器,它拥有一个令人惊叹的图像库和相应的提示,可以激发灵感。它可以通过迭代来发展创意,尝试不同的风格和颜色。

QQ截图20231211165707.jpg

体验地址:https://visualelectric.com/

【AiBase提要:】

🎨 创意激发: Visual Electric为创意工作者提供强大的图像生成能力,通过简单输入提示即可生成高质量图像。

🖌️ 直观创作空间: 白板式界面让用户清晰看到生成过程,可随时编辑和处理图像,集成了抠图等便捷功能。

🌈 多样风格选择: 提供精心打造的多种风格,让用户轻松尝试不同创意可能性,实现直观而多样的创作。

👨‍💻💡🎯聚焦开发者

阿里推视频生成框架DreaMovin

DreaMoving是阿里基于扩散模型的视频生成框架,通过图文输入可定制高质量人类舞蹈视频。框架包含Video ControlNet和Content Guider两大组件,实现运动控制和身份保留。通过姿势序列和简单描述,如文本和图像,DreaMoving生成高保真度视频。

image.png

项目网址:https://dreamoving.github.io/dreamoving/

【AiBase提要:】

🌐 框架介绍: DreaMoving是基于扩散模型的视频生成框架,可通过图文输入生成高质量舞蹈视频。

🔄 架构解析: Video ControlNet和Content Guider是关键组件,分别实现运动控制和身份保留,适用于不同风格的扩散模型。

🎬 成果展示: DreaMoving通过姿势序列和简单描述生成高保真度的定制视频,实现身份控制和外观控制。

UCLA推出Chameleon框架,大模型表格数学推理准确率达98.78%

由UCLA等机构推出的Chameleon框架通过多工具融合,包括LLMs、视觉模型、搜索引擎等,解决大型语言模型在实时信息获取和数学推理上的不足,在表格数学推理任务上达到98.78%准确率。

image.png

项目地址:https://chameleon-llm.github.io/

【AiBase提要:】

🦎 多工具融合: Chameleon框架融合LLMs、视觉模型、搜索引擎等多种工具,弥补大型语言模型在实时信息获取和数学推理方面的不足。

📊 表格数学推理准确率: Chameleon在表格数学推理任务中表现优异,准确率高达98.78%,超越现有模型,核心在于LLM规划器生成自然语言程序。

🌐 灵感来源: Chameleon模型灵感来源于变色龙,象征大型语言模型在执行外部工具组合推理任务时的多功能性和适应性,在学术界和开发者社区受到广泛关注。

举报

  • 相关推荐
  • 大家在看
  • LoomFlows:收集高质量用户反馈

    LoomFlows是一个收集高质量用户反馈的平台。它帮助您简化高质量反馈的收集,识别有影响力的机会,并通过构建合适的功能来加速发展。LoomFlows提供收集用户反馈的渠道、反馈分析、注释截图、Loom视频反馈等功能。它适用于个人和团队,有不同的定价计划供选择。

  • EazyCaptions:创建吸引人的视频,无需编辑技能

    EazyCaptions是一个让用户能够创建吸引人的视频的工具,无需编辑技能。它提供了眼球吸引的字幕、音效和B Roll素材,帮助用户制作出专业水准的视频。使用EazyCaptions,您可以节省大量的编辑时间,通过自动AI字幕生成准确的字幕,并自动突出重点词汇和添加表情符号。此外,它还提供了库存素材和快速的调整功能,帮助用户制作更多样化的视频内容。EazyCaptions适用于各种类型的创作者和内容创造者,如博主、教育工作者、评论员、新闻媒体等。定价方案灵活,包括免费试用和付费选项。

  • Merlin AI Plugins:AI插件,提升工作流效率

    Merlin是一个强大的AI助手,通过GPT 4技术提供1点击访问多种AI插件,包括视频摘要、网页抓取、邮件回复、社交媒体增长等功能。免费下载使用。

  • Udio AI:创造独特的 MP3音乐,立即免费使用

    Udio AI音乐生成器是一个用于音乐创作和分享的应用程序,可以根据您的输入,在您喜欢的风格中生成令人惊叹的音乐。它经过大量的音乐数据训练,可以快速创建您自己的音乐。Udio AI适用于音乐爱好者、创作者以及需要创作灵感的人。免费试用3次。

  • Businessflow Recruit:招聘革命,AI 助力招聘流程优化

    通过 AI 助手,提高招聘效率,降低成本,为公司找到最佳适应的候选人。拥有简历分析、候选人排名、自动面试等功能。定价根据企业规模定制。

  • Wookeys AI:一站式AI助手,为您提供生成文本、图像、代码、视频、音频等的解决方案

    Ultimate AI Assistant是一款综合AI助手,可帮助您简化任务,提高工作效率。它提供了生成文本、图像、代码、视频、音频等多种功能,具有高度定制化的AI解决方案。无论您是需要生成创意文案、设计图像、编写代码、制作视频还是创作音乐,Ultimate AI Assistant都能满足您的需求。该产品定价根据功能和使用量而定,详情请访问官方网站。

  • Sakura FM:与AI角色聊天

    Sakura AI是一个能够与AI角色聊天的平台。通过与AI角色的对话,用户可以探索、发现和创造新的AI体验。开始聊天,释放你的想象力。

  • lensa.app:影像增强AI工具

    Lensakey是一款影像增强AI工具,可一键进行照片修饰、去除干扰、应用时尚滤镜和效果,并创建独特的AI头像。它可以提升您的社交媒体影响力,轻松提升照片质量。

  • StockTune:免费音乐,无限可能

    StockTune 是一个免费音乐库,提供商用和个人使用的免费音乐下载,无需署名。库中拥有丰富多样的高品质音乐曲目,能够满足不同需求。价格:免费。

  • heardeer:10分钟内收集1000+用户访谈反馈

    heardeer可以在10分钟内收集1000+用户访谈反馈,让AI处理繁琐的用户访谈,您可以专注于更重要的任务。heardeer提供全球用户访谈,无需雇佣翻译人员,让用户以自己的母语参与访谈。同时,heardeer提供详细的转录和深度分析,为您节省时间。快来试试heardeer,开始您的用户访谈吧!

  • OneAccord:实时AI翻译为教堂

    OneAccord是一个实时AI翻译平台,为教堂提供语言翻译和字幕服务。它通过AI模型和人工校对,帮助教堂克服语言障碍,使教堂服务对听障人士也能无障碍参与。平台支持多种语言翻译和字幕功能,并提供定制品牌和在线访问。用户可以根据自己的需求选择月度订阅或一次性使用,并可以根据使用时间、语言和听众数量等参数来估算费用。

  • Kursaha:AI驱动的客户获取和参与解决方案

    Kursaha是一种AI驱动的客户获取和参与解决方案,通过定向广告活动、营销策略和参与客户来推动业务增长。核心功能包括实时分析、集成、自动生成OTP和验证、AI驱动的聊天自动化、受众预测和行为队列等。Kursaha是营销数据和产品团队的完整解决方案,帮助他们增强客户参与和获取策略。

  • AI Singing:AI音乐生成器

    AI音乐生成器是一个能够免费生成音乐的AI音乐生成器。它可以自动生成歌曲和歌唱。

  • Blahget:您的智能AI语音驱动型预算助手

    Blahget是一款先进的AI预算助手,可简化财务管理。它利用GPT-4驱动的语音识别技术,实现无缝跟踪支出和收入。从今天开始您的智能预算之旅吧。它可以通过语音快速创建、编辑和删除记录,支持搜索、筛选和排序等操作,并可执行数学计算。迄今已记录超过10万条数据条目。

  • Tools4AI:100% Java实现的LLM代理和大型行动模型

    Tools4AI是100%用Java实现的大型行动模型(LAM),可作为企业Java应用程序的LLM代理。该项目演示了如何将AI与企业工具或外部工具集成,将自然语言提示转换为可执行行为。这些提示可以被称为"行动提示"或"可执行提示"。通过利用AI能力,它简化了用户与复杂系统的交互,提高了生产力和创新能力。

  • SlideAI:AI制作演示文稿

    Slides AI是一款AI制作演示文稿的工具。它利用先进的AI算法分析您的主题,生成相关内容,并创建专业的PowerPoint幻灯片。Slides AI可以为您节省时间和精力,让您轻松创建专业而引人注目的演示文稿。

  • Ping Parrot:AI聊天机器人,帮助您处理客户支持

    Ping Parrot是一个AI聊天机器人平台,可以帮助您快速构建自定义的聊天机器人,并将其嵌入到您的网站上,帮助您处理客户支持。无需编码即可使用。聊天机器人可以根据您的数据进行训练,学习并提供最佳答案。您可以定制聊天机器人的外观以匹配您的品牌,并在80种语言中提供帮助。

  • Inpaint-web:免费的去除水印和物体的工具

    Inpaint-web 是一款永久免费的在线工具,只需一点击即可去除照片中的不想要对象,同时提供修复瑕疵功能。其独特的照片去除和修复功能让用户轻松实现照片编辑需求。用户无需下载安装任何软件,直接在网页上使用。Inpaint-web 定位于为用户提供便捷、高效的照片编辑解决方案。

  • MA-LMM:面向长期视频理解的大规模多模态模型

    MA-LMM是一种基于大语言模型的大规模多模态模型,主要针对长期视频理解进行设计。它采用在线处理视频的方式,并使用记忆库存储过去的视频信息,从而可以在不超过语言模型上下文长度限制或GPU内存限制的情况下,参考历史视频内容进行长期分析。MA-LMM可以无缝集成到当前的多模态语言模型中,并在长视频理解、视频问答和视频字幕等任务上取得了领先的性能。

  • eezyCollab:AI驱动的高效、低成本的影响力营销工具

    eezyCollab是一款AI驱动的影响力营销工具,能快速匹配合适的KOL,进行批量化电子邮件营销,帮助中小企业以低廉的成本进行影响力营销。该产品无需营销专业知识即可上手使用,简单易用,大幅提高了影响力营销的效率和可及性。

今日大家都在搜的词: