首页 > 业界 > 关键词  > VideoPoett最新资讯  > 正文

AI视野:谷歌推大模型VideoPoet;百度灵境矩阵升级;微软把DALL-E3集成到键盘;小红书AI设计服装刷屏

2023-12-20 15:25 · 稿源:站长之家

🤖📈💻💡大模型动态

谷歌推大语言模型VideoPoet

Google Research最近发布了一款名为VideoPoet的大型语言模型(LLM),旨在解决当前视频生成领域的挑战。

image.png

项目网址体验:https://top.aibase.com/tool/videopoet

【AiBase提要:】

1. 💻 Google Research团队推出一款名为VideoPoet的大型语言模型,旨在解决视频生成领域的挑战。

2. 🌈 VideoPoet支持多种视频生成任务,包括文本到视频、图像到视频、视频风格化、修复和修复以及视频到音频。

3. 🚀 与传统扩散模型不同,VideoPoet将多个视频生成功能融合在一个语言模型中,提供更高的集成度和学习能力。

百度灵境矩阵升级为文心大模型智能体平台

百度的灵境矩阵平台升级为文心大模型智能体平台,为开发者提供多样化的开发方式,支持开发者根据自身领域和应用场景,选择不同的开发方式,打造大模型时代的应用。

体验地址:https://top.aibase.com/tool/lingjingjuzhen

【AiBase提要:】

⭐ 智能体升级降低了开发门槛

⭐ 提供多种开发模式满足不同需求

⭐ 提供流量分发路径和商业机会

百川智能发布Turbo API

百川智能发布了Baichuan2-Turbo系列API,支持192K超长上下文窗口和搜索增强知识库的能力。

商业体验官网:https://platform.baichuan-ai.com/playground

百川大模型官网:https://www.baichuan-ai.com

【AiBase提要:】

⭐ Baichuan2-Turbo系列API支持192K超长上下文窗口

⭐ API增加搜索增强知识库的能力

⭐ 官网模型体验升级支持多种文本上传和URL输入

斯坦福大学开发AI模型PIGEON 仅通过几张照片找到你的位置

研究生们在斯坦福大学开发出一款 AI 模型,可以通过查看 Google 街景图像,以令人印象深刻的准确率确定具体位置。

论文网址:https://arxiv.org/abs/2307.05845

【AiBase提要:】

📱PIGEON模型可以通过图像准确预测位置,准确率高达92%。

📸模型基于OpenAI神经网络CLIP进行训练,另外还有PIGEOTTO模型。

🔒论文探讨了模型的伦理问题,如隐私问题,但也指出了其积极用途和潜力。

📰🤖📢AI新鲜事

微软把DALL-E3集成到键盘,任何APP中都可生图!

微软将DALL-E3集成到键盘,使用户可以在任何APP中使用该功能,通过输入提示词生成图片并直接嵌入键盘。

image.png

【AiBase提要:】

⭐ DALL-E3可以和手机键盘绑定,实现在任何APP中生成图片

⭐ 使用Microsoft Swiftkey输入法,并启用Swiftkey键盘

⭐ 点击表情符号,选择Create图标,输入提示词生成图片,支持iOS版本 Swiftkey 输入法切换至默认输入法。

英特尔第五代至强可扩展处理器发布

英特尔第五代至强可扩展处理器发布,在性能优化方面,英特尔将各种参数做了以下提升:CPU核心数量增加到64个,单核性能更高,每个内核都具备AI加速功能;采用全新I/O技术(CXL、PCIe5),UPI速度提升;内存带宽从4800MT/s提高至5600MT/s。

【AiBase提要:】

  • 第五代至强处理器AI训练和推理性能提升14倍。

  • 处理器采用全新I/O技术,包括CXL、PCIe5。

  • 新处理器在云计算和安全性方面性能提升实测体验。

Stability AI正式推出商业版会员计划

Stability AI正式推出商业版会员计划,针对 AI 模型的商业使用收费。

【AiBase提要:】

⦁ 会员计划分为免费、月费20美元和企业版三个层级。

⦁ Stability AI 希望通过收费会员计划为未来的研发提供资金支持。

⦁ 用户可以提前访问新的 AI 模型,但只有付费层级的会员可以进行商业使用。

小红书涂鸦功能推出新玩法,AI“设计服装”刷屏小红书

小红书推出的AI涂鸦功能让用户将随手涂鸦的草图转化为精美的服装设计图,受到广泛关注和讨论。

image.png

【AiBase提要:】

🎨 用户通过AI设计服装,将创意草图转化为实物,引爆小红书涂鸦热潮。

👗 AI设计服装功能在小红书上受欢迎,用户通过涂鸦展现创意,获得数万赞。

🤖 AI涂鸦结果具有一定随机性,成为小红书内容平台的热门“小游戏”。

OpenAI宣布:如GPT-5太危险,董事会有权否决奥特曼的决定

OpenAI宣布董事会有权否决决定,特别是对于GPT-5等前沿模型的安全风险,公司成立安全顾问团队,定期向管理层和董事会报告。

【AiBase提要:】

  • 公司董事会有权否决决定,设立安全顾问团队。

  • 成立三个安全团队,跟踪当下和未来AI风险,设立限制要求模型安全得分达标后才能进行下一开发阶段。

  • 定期进行安全演习,研究风险随模型规模扩大的演变。

研究人员发现,谷歌Gemini表现不如GPT-3.5Turbo

来自卡内基梅隆大学和BerriAI的研究团队对谷歌的GeminiPro进行了深入评估,并发现其在多项任务中表现不如OpenAI的GPT-3.5Turbo。

【AiBase提要:】

😞研究团队发现谷歌的Gemini Pro在多数任务上的表现不如OpenAI的老款GPT-3.5Turbo。

😯Google宣称即将推出性能更强大的Gemini Ultra,但这一消息并未能完全抚平研究结果带来的打击。

🧐研究发现谷歌的Gemini在人类性、形式逻辑、初等数学和专业医学等领域的表现较差,但在语言翻译领域表现出色。

抖音AI内容生成系统软著权获批

抖音视界有限公司的“基于人工智能的内容生成系统”软件著作权获登记批准,成立于2012年7月,法定代表人为张利东,注册资本3亿美元。

【AiBase提要:】

⭐抖音公司获批“基于人工智能的内容生成系统”软件著作权。

⭐AI绘画在社交媒体平台上引发高关注,对著作权保护具有重要意义。

⭐人工智能生成内容需负责任使用,社交媒体平台应加强管理和提升可信度。

抖音网友发起趣味挑战 AI眼中一万年前的麦当劳长啥样?

一位名为“Lucas的AI探索屋”的抖音网友通过使用ChatGPT,挑战探讨一万年前的麦当劳是什么样子,引起网友热议。

图片

【AiBase提要:】

🍟 网友通过ChatGPT探讨一万年前的麦当劳形象,展示不同年代的变化。

🤖 UGC挑战凸显用户与AI共创在品牌创意营销中的新可能性。

🍔 其他博主也通过ChatGPT挑战,如宇宙大爆炸时期的肯德基,掀起讨论热潮。

🤖📱💼AI应用

Copilot用户可通过Suno AI插件创作AI歌曲

微软的AI聊天机器人Copilot与AI音乐初创公司Suno合作推出插件,使用户能够通过简单文本提示随时创作原创AI歌曲,包括歌词。

image.png

【AiBase提要】

🎵 插件合作创新: 微软Copilot与Suno插件合作,让用户通过简单文本提示在Discord上创作AI音乐,包含歌词。

🌐 市场竞争激烈: 多家科技公司如Meta、谷歌也在测试生成式AI音乐工具,展示AI在音乐创作领域的潜力。

💡 版权和使用限制: Suno允许免费用户在非商业平台分享生成的AI歌曲,但商业化权利仅提供给付费用户。

AI视频类工具又出黑马!Tonic可自动选择并转换视频中的片段

一款名为Tonic的AI视频平台具有极低的视频AI转换成本,同时能够自动选择并转换视频的一小段,实现与原视频内容的完美融合。该平台的视觉风格和交互设计特别吸引年轻用户,操作简单,具有创意视频生成能力。

image.png

下载地址:https://top.aibase.com/tool/tonic

【AiBase提要】

⭐️Tonic平台拥有极低的视频AI转换成本,呈现出卓越的效果。

🎨平台的视觉风格和交互设计吸引年轻用户,具有创意视频生成能力。

📱Tonic操作简单,能够自动选择并转换视频的一小段,实现与原视频内容的完美融合。

Ludo.ai为游戏开发者推出文生视频生成器工具

这个工具使游戏开发者能够在短短几秒钟内创造游戏玩法视频,开启了快速、流畅地将游戏概念可视化的新时代。

截屏2023-12-20 上午11.20.58.jpg

【AiBase提要:】

😃 Ludo.ai已经在游戏开发工具中整合人工智能三年。

😃 Ludo.ai发布了视频生成器工具的测试版,游戏开发者能够在短短几秒钟内创造游戏玩法视频。

😃 Ludo.ai首席执行官认为2024年将是AI生成视频无处不在的一年。

Creatify:用AI做视频广告 便宜且高效

Creatify是一款通过人工智能技术生成高质量营销视频的应用,用户只需输入产品链接或上传相关描述和图片,即可获得便宜且高效的广告解决方案。

QQ截图20231220114416.jpg

官网地址:https://top.aibase.com/tool/creatify

【AiBase提要:】

🚀 快速高效广告生成: Creatify通过AI技术提供快速、高效且高质量的视频广告生成解决方案,为用户节省时间和成本。

💡 定制选择丰富: Creatify不仅提供AI生成的广告文案、一键输出渲染,还有丰富的语音和说话化身选择,满足不同品牌需求。

📈 创意落地优势: 广告业务是AI内容生成理想切入点,Creatify从产品页面获取内容,为广告创意提供便捷解决方案。

👨‍💻💡🎯聚焦开发者

微软Azure发布GPT-RAG,为LLM部署提供超智能解决方案

微软Azure最近推出了GPT-RAG,为大型语言模型提供超智能解决方案,确保在企业中更顺畅地运行,旨在满足对LLMs的需求。

【AiBase提要:】

⚙️ 自适应扩展: 解决方案自动调整大小,高峰期也保持良好性能。

🚀 未来设计: 采用前瞻性设计,包括潜在集成Cosmos DB进行分析存储。

🔒 安全框架: 遵循零信任原则,确保敏感数据得到谨慎处理,提供高度信息安全。

阿里云免费开源数据库AI算法PilotScope

阿里云开源数据库 AI 算法 PilotScope,通过中间件系统平台实现 AI 算法在数据库中的一键部署。使用 PilotScope 将 AI 算法嵌入数据库,查询优化等任务的速度提升了1到2倍。该技术已在阿里云内部试点应用,并通过 GitHub 和 Modelscope 魔搭社区对外免费开源。

【AiBase 提要】

1️⃣PilotScope 是阿里云提出的中间件系统平台,实现 AI 算法在数据库中的一键部署;

2️⃣使用 PilotScope 将 AI 算法嵌入数据库,查询优化等任务速度提升1到2倍;

3️⃣PilotScope 已在阿里云内部试点应用,并通过 GitHub 和 Modelscope 对外免费开源。

2024年最重要AI图引热议 开源AI模型正在超越专有模型

开源本地AI模型正逐步超越大规模云模型,LeCun等专家认可,2024年可能迎来开源AI的重要转折,挑战传统闭源开发模式。

image.png

【AiBase提要】

🌐 趋势确认:2024年最重要AI图表显示,开源本地模型在5-Shot MMLU基准测试中超越大规模云模型,LeCun等专业人士认可。

🚀 竞争格局: 预计两年内,开源和闭源模型的性能曲线将相交,突显开源社区推动的生成式AI,可能挑战传统闭源AI开发模式,使人工智能更加民主化。

🤝 全球支持: Meta和IBM牵头成立AI联盟,有50多家科技公司、高校和机构加入,明确支持开放创新和科学,显示全球支持开源的合作势头。

举报

  • 相关推荐
  • 超擎速度!全国首批NVIDIA DGX Spark率先抵达超擎数智,现货在仓,交付启动

    10月19日,全国首批NVIDIA DGX Spark桌面级AI超算率先抵达超擎数智并开始交付。这款"全球最小AI超算"在发布72小时内落地中国市场,为企业和科研机构提供强劲算力。产品预装完整AI软件栈,实现开箱即用,配备详细快速指南和专业支持团队,助力开发者无缝对接顶尖计算能力,加速AI本地化开发创新。

  • Vidda 火星基地亮剑:C5 领衔四件套,改写影音产品性能规则

    Vidda在AWE展会发布多款创新产品:C5无界Master投影仪搭载SST架构DMD芯片、双激光器和122mm影院级镜头,实现6800CVIA高亮度和精准色彩;发现X2026电视采用"墨晶屏"技术,解决强光反光问题;同时推出V11开放式耳机与G11智能眼镜,以轻量化设计提升佩戴体验。整场发布会通过实机拆解和极限测试,展现品牌"技术平权"理念,强调用户体验优先于参数竞争。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • 菁彩Vivid影院技术新标准发布,国产自研影音技术再升级

    在高质量观影与产业发展需求驱动下,中国电影科研所联合行业机构研发"菁彩影院技术",制定LED影院图像发行母版与音频处理器两项技术标准。该技术融合自主创新的菁彩Vivid技术与国际标准,实现高亮度、高动态范围等优质画面效果,支持沉浸式音频处理。目前全国已部署约180块LED电影屏,相关影片正式上映,标志着我国在高格式电影技术领域取得突破,为国产技术国际化提供支撑。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • AI日报:阿里夸克“C计划”曝光;Veo3.1将增加视频“精确编辑”功能;Anthropic推出Claude Code网页版

    今日AI领域动态:阿里夸克启动"C计划"布局对话式AI应用,剑指字节"豆包";Anthropic推出Claude Code网页版,支持浏览器直接编码;谷歌Veo新增视频"精确编辑"功能,提升创作效率;Fish Audio升级S1语音克隆模型,10秒即可复刻真人声音;AWS美东故障影响ChatGPT等多项服务;DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈;Adobe推出AI Foundry服务,支持企业定制品牌AI模型;Anthropic发布Claude for Life Sciences,加速生命科学研究。

  • 如何让你的内容被 ChatGPT 优先引用?——GEO 优化实战指南

    传统SEO追求"谷歌首页排名",生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法,更像黑箱,使内容创作者困惑。GEO优化的核心是让内容具备"可引用性":权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率",分析引用语境、竞争差距,调整内容结构以提升AI引用倾向。SEO优化机器如何找到你,GEO则优化AI如何引用你。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • 守护用户数据安全,OPPO 携火山引擎发布《移动 Agent 安全技术白皮书》

    在OPPO开发者大会上,OPPO联合火山引擎等机构发布《移动Agent安全技术白皮书》,宣布打造隐私计算云系统,通过端云协同架构构建用户数据全生命周期的“安全长城”。该系统结合火山引擎AI机密计算方案,实现端到端加密,确保数据“可用不可见”,任何人与系统均无法获取用户数据。双方将持续深化合作,致力于AI时代的数据安全治理,让用户享受AI便利的同时更安全放心。

  • OPPO Find X9系列卖爆了,这下全网都在找追光红?

    在国产高端手机市场竞争白热化的当下,用户留存率与新品市场热度已成为衡量品牌竞争力的核心指标。而在双十一狂欢这一关键节点下,OPPO Find X9系列市场反响强烈,俨然已成爆款。

今日大家都在搜的词: