首页 > 业界 > 关键词  > FLUX最新资讯  > 正文

AI日报:生图只需8步!字节开源FLUX Lora;iPhone16发布会AI是重点;华为启动AI百校计划

2024-08-27 15:23 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、字节跳动开源FLUX Dev的Hyper SD Lora

在AI技术飞速发展的今天,字节跳动的开源动作再次成为行业焦点。FLUX Dev的Hyper SD Lora以其高效的图片生成能力,将AI绘图推向了一个全新的速度纪元。尽管画质有所折损,但速度提升将为AI绘图领域带来新的变革。

image.png

【AiBase提要:】

🚀 Hyper SD Lora大幅缩短了AI绘图时间,仅需8步或16步操作流程。

🎨 用户可在Huggingface上体验FLUX8步Lora的绘图效果,见证AI绘图技术飞跃。

🔍 Hyper SD Lora与原始版本绘制毛毛虫的对比显示画质折损,但在实际应用中可接受

模型地址:https://huggingface.co/ByteDance/Hyper-SD/blob/main/Hyper-FLUX.1-dev-8steps-lora.safetensors

在线体验:https://huggingface.co/spaces/ByteDance/Hyper-FLUX-8Steps-LoRA

2、苹果iPhone16发布会定档9月9日

苹果公司正式宣布了2024年9月9日举行的iPhone16发布会,主题为“It's Glowtime”。本次发布会将带来iPhone16系列的重大变化和新功能,令人期待。人工智能和苹果智能功能也将成为重要焦点,为用户带来更多惊喜。除了iPhone16系列,还可能推出Apple Watch Series10和新版本的AirPods,内容丰富。

image.png

【AiBase提要:】

✨ iPhone16发布会定于2024年9月9日,地点为苹果园区的史蒂夫・乔布斯剧院。

📸 iPhone16和16Plus将采用新的垂直对齐摄像头设计,iPhone16Pro系列可能推出青铜色新版本。

🔔 所有iPhone16型号将配备“动作按钮”,可能新增专门用于拍照的视频按钮。

3、华为启动AI百校计划,每年最高100万昇腾云AI计算资源支持

华为公司最近推出的AI百校计划为国内高校师生提供昇腾云AI计算资源支持,解决算力瓶颈,促进科研创新和人才培养。该计划关注高校团队在AI领域的研究和影响力,资助基础技术研究、产业问题解决和人才培养。华为将评估项目的目标、创新性和对产业影响,每年获得昇腾云AI计算资源支持可达100万。华为战略研究院院长周红博士强调计划助力科研创新和AI人才培养。

【AiBase提要:】

🚀 华为AI百校计划为高校提供昇腾云AI计算资源支持,解决算力瓶颈,促进科研创新和人才培养。

💡 计划关注高校团队在AI领域的研究和影响力,资助基础技术研究、产业问题解决和人才培养。

💻 评审项目的目标、创新性和对产业影响,每年获得昇腾云AI计算资源支持可达100万。

4、快手可灵AI已累计生成超1600万视频

我对这篇文章感到非常震撼,快手可灵AI的成功应用为创作者提供了强大的创作平台,同时也推动了AI技术在视频生成领域的进一步发展。

image.png

【AiBase提要:】

🚀 超过160万人使用可灵 AI,生成视频超过1600万部!

🎥 可灵 AI 于7月30日全球上线,成为首个可用的真实影像级视频生成大模型。

🤖 AI 技术助力创作者专注于创意,简化视频制作过程。

5、谷歌Photos测试全新AI搜索功能 “Ask Photos” ,搜图更简单

谷歌正在进行一项重大升级测试,推出“Ask Photos”功能,允许用户通过自然语言与照片库互动,将照片和视频变成智能视觉数据库。相关代码已出现在最新谷歌应用版本中,预示功能即将推出。未来可能结合Google Lens,提供实时信息,增强搜索体验。

image.png

【AiBase提要:】

🌟 谷歌进行“Ask Photos”功能测试,用户可自然语言与照片库互动。

🖼️ 相关代码已出现在最新谷歌应用版本中,预示功能即将推出。

🔍 未来可能结合Google Lens,提供实时信息,增强搜索体验。

6、三星智能冰箱将推AI生成壁纸功能,还能自定义风格和主题

最近,三星宣布将为其智能家电带来新一轮的 AI 功能,其中最引人注目的就是智能冰箱将支持 AI 生成壁纸。除此之外,三星还对其 Bixby 语音助手进行了升级,增强了智能家居的控制能力。随着这些新功能的推出,三星的智能家电将变得更加智能,让用户的生活更加便利和个性化。

【AiBase提要:】

🌟 AI 生成壁纸: 三星智能冰箱将支持 AI 生成壁纸功能,用户可自定义风格和主题。

🤖 Bixby 升级: 新的 Bixby 助手能理解更复杂的指令,记住用户之前的对话,提升智能家居控制能力。

🆕 适用型号有限: 只有2024年推出的特定三星家电型号才能享受到 Bixby 的升级服务。

7、设计师新神器来了!SuperCraft

SuperCraft是一款重塑设计流程的新神器,通过生成式AI技术将手绘草图转化为逼真的产品图像和3D模型。设计师们可以在无限大的协作画布上自由创作,享受高效有序的设计过程。SuperCraft内置的3D查看器让设计师审视每个细节,导出设计成.glb格式后,设计即可从屏幕走向现实世界。

【AiBase提要:】

✨ 生成式AI技术将手绘草图转化为高质量的2D图像和3D渲染模型

🎨 无限大的协作画布,简化设计过程,提供无限创造空间

🔍 节点式流程设计和3D查看器帮助设计师高效组织设计思路,确保每个细节达到完美

详情链接:https://supercraft.ai/

8、OpenAI、Adobe与微软联手支持加州新法,标记AI生成内容

三大科技巨头联合支持加州新法案AB3211,要求标记AI生成内容,展示科技公司在内容透明化方面的努力。法案修订后得到行业团体支持,引发广泛讨论。

【AiBase提要:】

✅ 加州AB3211法案要求标记AI生成内容元数据中添加水印,并在大型平台上以易懂方式标识。

✅ OpenAI、Adobe和微软是“内容来源和真实性联盟”成员,支持C2PA元数据标准,用于标记AI生成内容。

✅ 行业团体曾反对AB3211法案,但随着修订内容变化,现已支持通过。

9、XLabs发布视频生成项目Deforum:用FLUX点燃动画革命,一键生成星际奇幻

XLabs最新发布的Deforum项目基于FLUX技术,能快速将创意转化为引人入胜的动画,操作简便且具有高度定制性。FLUX展现出卓越的模型质量,让动画细节更生动真实。通过GitHub,Deforum项目触手可及,一行命令即可启动令人兴奋的视频生成。Deforum提供多种动画模式选择,让视觉效果更上一层楼。

【AiBase提要:】

✨ FLUX技术快速转化创意为引人入胜动画,操作简便且高度定制。

🌌 FLUX展现卓越模型质量,让动画细节更生动真实。

🚀 Deforum提供多种动画模式选择,让视觉效果更上一层楼。

详情链接:https://github.com/XLabs-AI/deforum-x-flux

10、高通加入AR联盟 创始成员包括 META、谷歌等

高通正式加入了增强现实(AR)联盟,成为该联盟董事会的最后一位创始成员。这一举动将促进AR硬件开发,为增强现实技术的未来发展开辟新的可能性。

【AiBase提要:】

🌟 高通加入AR联盟,成为最后一位创始成员,促进AR硬件开发。

🤝 AR联盟的创始成员包括META、谷歌等,致力于提升用户体验。

👓 高通与Kittch合作推出AR眼镜,应用于烹饪教学。

11、字节跳动强化AI布局:大模型研究院筹备

字节跳动正积极加强人工智能大模型领域布局,计划成立大模型研究院并招揽顶尖人才。公司已有外部AI专家加入,包括秦禹嘉和黄文灏。黄文灏将负责技术项目管理,向朱文佳汇报。朱文佳领导首个大型模型研发团队。尽管尚未确定是否建立独立研究机构,字节跳动的动作显示其积极布局AI大模型领域,以在技术竞争中占据优势地位。

【AiBase提要:】

🔍 字节跳动计划成立大模型研究院并招揽顶尖人才。

👥 外部AI专家已加入,包括秦禹嘉和黄文灏。

🚀 字节跳动积极布局AI大模型领域,朱文佳领导首个大型模型研发团队。

举报

  • 相关推荐
  • 大家在看
  • We, Robot:特斯拉自动驾驶技术与机器人的未来愿景

    We, Robot 是特斯拉公司展示其在自动驾驶技术和机器人技术领域愿景的页面。它强调了特斯拉对于创建可持续未来、提高交通效率、可负担性和安全性的承诺。该页面介绍了特斯拉的全自动驾驶技术(监督)以及未来自动驾驶汽车和机器人的潜在应用,如Robotaxi、Robovan和Tesla Bot。这些技术旨在通过自动化提高日常生活的便利性,同时减少交通事故,降低交通成本。

  • Kimi探索版:深度推理AI搜索功能,像人类一样思考和解决问题。

    Kimi探索版是Kimi新增的深度推理AI搜索功能,通过理解、拆解问题,再进行搜索和推理给出答案,一次搜索即可精读500个页面。新功能让Kimi能像人类一样思考,提供更准确、实用的搜索结果。还能使用数学模型和编程处理复杂问题,并在必要时进行自我反思以优化答案。简而言之,Kimi探索版让AI搜索更智能,更接近人脑的工作方式。

  • The Innovation Workspace:AI驱动的协作平台,助力团队从想法到成果快速推进。

    The Innovation Workspace 是一个集成了人工智能技术的协作平台,旨在帮助团队更高效地将想法转化为实际成果。它提供了一个无限的画布空间,让团队可以添加内容、推进项目,并共同工作直至想法成真。该平台拥有超过80M用户和250,000家公司,正在使用它来加速和管理他们的端到端创新生命周期。Miro提供了广泛的配置和原生安全控制,以适应不同组织规模和复杂性的具体要求。

  • Inbox AI:AI驱动的个人生产力工具

    Inbox AI是一款AI驱动的个人生产力工具,旨在帮助用户通过智能化的方式管理和自动化电子邮件任务。它提供了基于云的AI服务,同时也支持隐私优先的本地AI处理。用户可以根据自己的需求选择使用在线AI或本地AI,以提高日常工作效率,减少重复性任务,专注于更重要的事情。Inbox AI的主要优点包括无需重复订阅费用、支持多种输入方式(如邮件、屏幕截图、语音命令等)、与多种应用(如Notion、Obsidian等)集成,以及提供Apple Mail扩展等。

  • State of AI Report 2024:2024年AI发展状态的权威报告

    State of AI Report 2024是由AI领域投资者Nathan Benaich和Air Street Capital共同制作的年度报告,旨在分析AI领域最有趣的发展,并引发关于AI现状及其对未来影响的知情讨论。报告涵盖了研究、产业、政治、安全等多个维度,提供了对未来AI发展的预测和评估。这份报告是了解AI领域最新进展和趋势的重要资源,对于研究人员、企业家、政策制定者以及对AI感兴趣的公众都具有极高的参考价值。

  • Cheating LLM Benchmarks:研究项目,探索自动语言模型基准测试中的作弊行为。

    Cheating LLM Benchmarks 是一个研究项目,旨在通过构建所谓的“零模型”(null models)来探索在自动语言模型(LLM)基准测试中的作弊行为。该项目通过实验发现,即使是简单的零模型也能在这些基准测试中取得高胜率,这挑战了现有基准测试的有效性和可靠性。该研究对于理解当前语言模型的局限性和改进基准测试方法具有重要意义。

  • Cove:AI协作者,共同探索、规划和工作的新方式。

    Cove是一个新型的AI协作者,它通过共享工作空间、直接编辑内容、学习用户添加的内容,并提供多个可能的方向来推动用户的工作。Cove利用最新的网络数据,加速用户的工作,同时通过并行搜索提高效率。Cove支持多种文件格式,如文本、表格、图像、网页和PDF等,让AI和用户之间共享上下文,从而更好地协作。Cove的产品背景信息包括由红杉资本领投的600万美元种子轮融资,并且提供Chrome扩展,方便用户在不同的网站和应用中使用。

  • Kvistly:AI驱动的互动式测验制作工具

    Kvistly是一个利用人工智能技术创建互动式测验的平台,旨在提升销售培训、团队建设、培训和入职等环节的效率和参与度。它通过实时的互动学习连接真人,增强团队协作和知识传递。产品背景信息显示,Kvistly在教育和商业培训领域具有重要性,通过游戏化学习提高员工的参与度和学习效果。价格方面,Kvistly提供定价信息,但具体细节需访问其定价页面了解。

  • Quetzal:现代国际化平台,快速实现产品多语言支持。

    Quetzal是一个现代国际化平台,旨在帮助用户快速将产品翻译成多种语言,以获得全球新客户。该平台提供工具,支持20多种语言,与Next.js和React兼容,并且拥有快速设置流程,仅需约10分钟。Quetzal利用人工智能技术,结合应用程序的上下文,在几分钟内实现最佳翻译效果。它还提供了一个仪表板,让用户可以在一个地方查看和管理所有的字符串。产品背景信息显示,Quetzal由Quetzal Labs, Inc.在奥克兰精心打造,并且提供了一个慷慨的免费计划,直到用户添加第二种语言。

  • Aria:多模态原生混合专家模型

    Aria是一个多模态原生混合专家模型,具有强大的多模态、语言和编码任务性能。它在视频和文档理解方面表现出色,支持长达64K的多模态输入,能够在10秒内描述一个256帧的视频。Aria模型的参数量为25.3B,能够在单个A100(80GB)GPU上使用bfloat16精度进行加载。Aria的开发背景是满足对多模态数据理解的需求,特别是在视频和文档处理方面。它是一个开源模型,旨在推动多模态人工智能的发展。

  • Marqo:训练和部署嵌入式模型的AI平台

    Marqo是一个专注于训练和部署嵌入式模型的平台,它提供了一个端到端的解决方案,从模型训练到推理,再到存储。Marqo支持150多种嵌入式模型,并且可以快速原型设计,加速迭代,并无缝部署。该平台支持多模态模型,如CLIP,可以从图像和其他数据类型中提取语义信息,实现文本和图像的无缝搜索,甚至可以将文本和图像组合成一个向量。Marqo还支持100多种语言的搜索,提供最先进的多语言模型,无需手动进行语言配置即可扩展到新的地区。此外,Marqo的可扩展性允许用户在笔记本电脑上的Docker镜像中运行,也可以扩展到云端数十个GPU推理节点,提供低延迟的搜索服务。

  • AMD Instinct MI325X Accelerators:为AI基础设施提供领导性的AI性能

    AMD Instinct MI325X加速器基于AMD CDNA 3架构,专为AI任务设计,包括基础模型训练、微调和推理,提供卓越的性能和效率。这些产品使AMD的客户和合作伙伴能够在系统、机架和数据中心层面创建高性能和优化的AI解决方案。AMD Instinct MI325X加速器提供了行业领先的内存容量和带宽,支持6.0TB/s的256GB HBM3E,比H200多1.8倍的容量和1.3倍的带宽,提供了更高的FP16和FP8计算性能。

  • Ryzen™ AI PRO 300 Series Processors:第三代商用AI移动处理器,为商务用户带来前所未有的AI计算能力和多日电池续航。

    AMD Ryzen™ AI PRO 300系列处理器是专为企业用户设计的第三代商用AI移动处理器。它们通过集成的NPU提供高达50+ TOPS的AI处理能力,是市场上同类产品中性能最强的。这些处理器不仅能够处理日常的工作任务,还特别为满足商务环境中对AI计算能力的需求而设计,如实时字幕、语言翻译和高级AI图像生成等。它们基于4nm工艺制造,并采用创新的电源管理技术,能够提供理想的电池续航能力,非常适合需要在移动状态下保持高性能和生产力的商务人士。

  • Unify Plays:快速构建端到端的营销活动

    Unify Plays是一个商业营销平台,它通过集成AI、自动化和数据验证技术,帮助企业构建和运行能够生成潜在客户并促进销售的营销活动。这个平台的主要优点在于其一体化的解决方案,能够减少企业在营销活动中对多个工具的依赖,提高效率,同时通过AI技术实现个性化营销,提升客户参与度和转化率。Unify Plays的背景信息显示,它是由Unify公司开发,旨在为高增长企业提供一种更高效、更智能的营销方式。关于价格,Unify Plays提供了不同的套餐选项,以满足不同规模企业的需求。

  • Eddie AI:您的AI故事讲述伙伴

    Eddie AI是一个创新的视频编辑平台,它利用人工智能技术帮助用户快速、轻松地编辑视频。这个平台的主要优点是它的用户友好性和高效率,它允许用户像与另一个编辑交谈一样与AI对话,提出他们想要的视频剪辑类型。Eddie AI的背景信息显示,它旨在通过使用自定义的AI编辑/故事模型来扩展视频编辑的规模,这表明它在视频制作领域具有潜在的革命性影响。

  • Cooraft:将自拍变成艺术工作室视频和照片,卡通动画和艺术渲染,只需一键。

    Cooraft是一款利用人工智能技术将普通照片转化为艺术作品的应用程序。它能够将自拍和日常照片转化为具有创意和艺术性的动画和渲染图,提供从3D卡通到经典绘画等多种艺术风格。Cooraft不仅能够美化人像,还能将素描、绘画、线稿等多种输入转化为新的渲染图,实现从2D到3D的转变。此外,Cooraft还提供了订阅服务,用户可以通过订阅获得更多高级功能。

  • DreamMesh4D:从单目视频生成高质量4D对象的新型框架

    DreamMesh4D是一个结合了网格表示与稀疏控制变形技术的新型框架,能够从单目视频中生成高质量的4D对象。该技术通过结合隐式神经辐射场(NeRF)或显式的高斯绘制作为底层表示,解决了传统方法在空间-时间一致性和表面纹理质量方面的挑战。DreamMesh4D利用现代3D动画流程的灵感,将高斯绘制绑定到三角网格表面,实现了纹理和网格顶点的可微优化。该框架开始于由单图像3D生成方法提供的粗糙网格,通过均匀采样稀疏点来构建变形图,以提高计算效率并提供额外的约束。通过两阶段学习,结合参考视图光度损失、得分蒸馏损失以及其他正则化损失,实现了静态表面高斯和网格顶点以及动态变形网络的学习。DreamMesh4D在渲染质量和空间-时间一致性方面优于以往的视频到4D生成方法,并且其基于网格的表示与现代几何流程兼容,展示了其在3D游戏和电影行业的潜力。

  • Kaption AI:使用AI技术将WhatsApp音频消息转文字并生成摘要

    Kaption AI是一款Chrome浏览器插件,它利用人工智能技术将WhatsApp上的音频消息转换成文字,并提供消息摘要和回复建议。这款插件重视用户隐私和安全性,采用先进的AI技术实现准确的转录和总结。它特别适合那些经常使用WhatsApp且难以听取长音频消息的用户,帮助他们节省时间,只关注重要的信息。

  • CursorCore:开源AI辅助编程模型系列

    CursorCore是一系列开源模型,旨在通过编程指令对齐来协助编程,支持自动化编辑和内联聊天等功能。这些功能模仿了如Cursor这样的闭源AI辅助编程工具的核心能力。该项目通过开源社区的力量,推动了AI在编程领域的应用,使得开发者能够更加高效地编写和编辑代码。目前该项目处于早期阶段,但已经展示了其在提高编程效率和辅助代码生成方面的潜力。

  • WiseWorld:AI驱动的虚拟世界,用于软技能评估和培训

    WiseWorld是一个利用人工智能和游戏化技术来提升员工软技能的平台。它通过模拟真实生活情景,帮助员工在沟通、问题解决、团队合作等方面进行实践和提升。WiseWorld通过角色扮演和模拟练习,为团队领导者和成员提供了一个安全的环境来尝试不同的策略并获取即时反馈。此外,它还提供了一个管理者仪表板,使领导者能够实时了解团队动态、个人表现和整体进展,从而做出数据驱动的决策,提高领导效能和团队凝聚力。

今日大家都在搜的词: