首页 > 业界 > 关键词  > Genspark最新资讯  > 正文

AI日报:前百度高管推AI搜索产品Genspark;Kimi内测上下文缓存功能;TikTok推AI全家桶Symphony;橙篇已支持10万字长文生成

2024-06-20 14:27 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、前百度高管景鲲创业AI搜索估值18亿 推出首款产品Genspark

作为前百度高管,景鲲创立了新公司MainFunc并推出首款产品Genspark,旨在通过AI技术提供优质搜索体验。公司获得6000万美元种子轮融资,估值达到2.6亿美元,展现出巨大市场潜力。景鲲的履历卓越,现在再次领先AI搜索领域,期待其继续创新发展。

image.png

【AiBase提要:】

🚀 MainFunc是由景鲲和前小度CTO朱凯华共同创立的AI创新产品公司,推出首款AI Agent搜索产品Genspark。

💰 公司完成6000万美元的种子轮融资,估值达到2.6亿美元,市场潜力巨大。

🔍 Genspark定位为AI Agent引擎,专注提供搜索服务,通过AI技术生成名为"Sparkpages"的自定义页面,节省用户时间提供可信信息。

官网地址:https://mainfunc.ai/

搜索产品入口:https://top.aibase.com/tool/sparkpage

2、Kimi 开放平台将启动 Context Caching上下文缓存 内测

Kimi 开放平台近日宣布,备受期待的Context Caching功能即将启动内测。这一创新功能将支持长文本大模型,并通过高效的上下文缓存机制,为用户提供前所未有的体验。Context Caching是一项前沿技术,通过缓存重复的Tokens内容,大幅度降低用户在请求相同内容时的成本。

微信截图_20240620091624.png

【AiBase提要:】

🔑 Context Caching功能支持长文本大模型,通过高效的上下文缓存机制提供前所未有的体验。

🚀 Context Caching能智能识别并存储已处理的文本片段,极大提升API接口响应速度。

💡 适用于规模化、重复度高的prompt场景,通过重用已缓存的内容提升处理效率、降低费用。

3、TikTok推AI全家桶Symphony 写脚本,剪视频,数字人全包

TikTok推出的Symphony AI内容工具套件彻底改变了内容创作和分享方式,让每个人都能成为创意大师。Symphony Assistant提供贴心的帮助,发现趋势、提供创意指导、激发灵感、编写脚本,并给出优化建议。Symphony Creative Studio能在60秒内生成多种TikTok视频预览,支持多语言翻译和视频编辑。Symphony Digital Avatars帮助品牌扩展创意策略,提供真实人物头像。

【AiBase提要:】

🚀 Symphony Assistant提供全方位创作帮助,从趋势发现到脚本编写,让创作过程更简单高效。

💡 Symphony Creative Studio支持快速生成多样TikTok视频预览,多语言翻译和视频编辑功能让内容更具吸引力。

👤 Symphony Digital Avatars通过生成式AI创建真实人物头像,帮助品牌扩展全球创意策略。

详情链接:https://www.tiktok.com/business/en-US/blog/tiktok-symphony-ai-creative-suite

4、百度文库:AI产品“橙篇”已支持10万字长文生成

百度文库最新推出的AI产品“橙篇”在长文生成和多模态编辑方面取得重大突破,为用户提供全面的创作和编辑功能。产品基于强大的AI技术支持,让用户能够轻松访问专业学术资源、创作超长图文内容,并实现一站式的多格式编辑和调整。

image.png

【AiBase提要:】

🚀 “橙篇”支持10万字长文生成及多模态编辑能力,满足用户专业领域内的全链路需求。

💡 打破学术资源壁垒,让用户轻松访问全球专业学术站点资料和文献资料。

✨ 支持超长图文理解和生成,一次性上传多种格式文件并实现快速总结、问答和创作。

详情链接:https://top.aibase.com/tool/chengpianai

5、首个AI高考评测结果发布 GPT-4o拿下第二名

在这场别开生面的AI高考评测中,多个AI模型接受了语文、数学和英语的全面能力测试,展现出了在学术领域的潜力和局限性。虽然在语文和英语科目表现良好,但在数学推理方面仍有提升空间。未来随着技术的进步,AI将更加聪明,更好地服务人类社会。

【AiBase提要:】

🧠 AI模型参与全面能力测试,展现学术潜力和局限性。

📚 语文和英语科目表现良好,数学推理方面仍有提升空间。

🚀 技术进步将使AI变得更加聪明,更好地服务人类社会。

6、Flash Diffusion适用于任何扩散模型,实现几步图像生成

Flash Diffusion方法为图像生成技术带来革命性突破,加速了预训练扩散模型生成过程,表现出色且高效多才多艺。研究人员采用可调整的分布和对抗目标等创新手段,提高预测模型定位和计算效率。该方法适应不同骨干网络,显著减少采样步骤同时保持高质量生成。Flash Diffusion注入新活力,提升图像生成效率和多功能性,有望在各领域产生深远影响。

image.png

【AiBase提要:】

⚡ 加速预训练扩散模型生成过程,表现出色且高效多才多艺。

🔍 采用可调整的分布和对抗目标等创新手段,提高预测模型定位和计算效率。

🌟 适应不同骨干网络,显著减少采样步骤同时保持高质量生成。

详情链接:https://top.aibase.com/tool/flash-diffusion

7、AI生图可“量身定制”!华为清华联手推个性化生成技术PMG

在个性化至上的时代,华为与清华大学合作推出了名为PMG的个性化生成技术。该技术利用用户历史行为和偏好,生成符合用户需求的多模态内容,如表情包、T恤设计图、电影海报等。通过实验验证,PMG技术展现出巨大潜力和商业价值,为用户带来更加丰富、个性化的体验。

image.png

【AiBase提要:】

⚙️ PMG技术利用用户历史行为和偏好生成个性化多模态内容。

💡 PMG通过关键词生成和隐向量生成提取用户偏好,实现多模态内容生成。

📈 PMG技术在电商服装图片生成、电影海报场景和表情生成等应用场景中验证有效性,展现出色的生成效果。

详情链接:https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG

8、Gboard革新打字体验 谷歌凭大模型实现一键修复所有错误

Gboard是Google为移动设备打造的智能键盘,最新推出的"校对"功能利用大型语言模型实现一键修复整个句子和段落错误,彻底改变了传统的逐字修正体验。该功能已在Pixel8设备上推出,受益用户众多。研究团队通过复杂的错误合成框架生成模拟数据集,结合监督学习和强化学习技术优化模型性能,展示了大模型在提升移动端输入交互体验方面的巨大潜能。

【AiBase提要:】

🔍 利用大型语言模型实现一键修复整个句子和段落错误,改变传统逐字修正体验。

🚀 通过复杂的错误合成框架生成模拟数据集,结合监督学习和强化学习技术优化模型性能。

💡 部署在云端TPU V5上,通过优化延迟等手段提升用户输入效率。

详情链接:https://arxiv.org/abs/2406.04523

9、可以在Confyui中用英伟达的Lumina-T2X图像生成了

英伟达的 Lumina-T2X 图像生成模型可以在Confyui中用英伟达的Lumina-T2X图像生成了,作为一个开源模型,它在美学表现和图像质量上与业界领先的MJ V6 相差无几,这一成就在开源领域尤为难能可贵。

image.png

【AiBase提要:】

🌟 Lumina-T2X采用统一的DiT架构,能生成多种媒体内容,拓展AI在内容创作领域的应用范围。

💡 Lumina-T2I图像生成模型提高生成质量、降低训练成本,展示AI技术的经济潜力。

🔑 Lumina-T2I的成功关键在于模型主干采用Large-DiT、文本编码模型使用Llama2-7B、VAE采用SDXL,为高质量图像生成奠定基础。

感兴趣的可以在 Confyui 中使用这个插件尝试::https://github.com/kijai/ComfyUI-LuminaWrapper

10、OpenAI灵魂人物Ilya创办新AI公司SSI 剑指安全超级智能

Ilya Sutskever离职后创立Safe Superintelligence Inc.专注解决超级智能人工智能系统安全性问题。公司致力于研究控制和限制超越人类智能的AI,并计划通过工程和科学突破解决安全性难题。SSI从一开始就是营利性实体,不受短期商业压力影响,目前正在招聘技术人才。

【AiBase提要:】

🔒 SSI专注解决超级智能AI系统安全性问题,致力于研究控制和限制超越人类智能的方法。

🚀 SSI计划通过工程和科学突破解决AI安全性难题,提高AI能力和安全性。

💼 SSI是一家营利性实体,不受短期商业压力影响,正在招聘技术人才。

11、GPT-4通过图灵测试 超过一半的人无法区分GPT-4和人类

人工智能领域的重要里程碑之一是图灵测试,最近一项实验显示,GPT-4在互动式双人图灵测试中被误认为人类的概率高达54%,引发人们对AI系统逼真表现的关注。参与者更倾向于使用语言风格和社会情感因素来判断对方是否为人类,这对机器智能的讨论产生了深远影响。

【AiBase提要:】

🤖 GPT-4在图灵测试中被误认为人类的概率高达54%,展现出逼真的表现

🔍 参与者更倾向于使用语言风格和社会情感因素来判断对方是否为人类

💡 结果暗示了AI系统在实际应用中可能欺骗人类,提出了新的伦理、隐私和安全性挑战

12、AI设计工具Kittl:输入文字提示即可生成图标、剪贴画等

Kittl是一款AI驱动的设计平台,利用先进算法和机器学习,用户可通过简单文本提示创建高质量设计元素,无需复杂技能和软件操作。提供矢量标志图标、令人惊叹的图像和剪贴画,高级文本编辑,魔法着色,即用型模板。用户可访问插图、字体、照片、图标、纹理等无限内容,轻松拖放并自定义。

【AiBase提要:】

⭐ 利用AI技术和机器学习,用户通过简单文字提示即可创建高质量设计元素。

⭐ 提供成千上万的专业设计模板,无需复杂的设计技能和软件操作。

⭐ 用户可轻松拖放高质量插图、照片、图标和形状,并自定义。

产品入口:https://top.aibase.com/tool/kittl

举报

  • 相关推荐
  • 大家在看
  • Prime Intellect:AI开发规模化的民主化平台

    Prime Intellect是一个致力于AI开发规模化民主化的平台,提供全球计算资源的发现、模型训练以及共同拥有智能创新的能力。它通过分布式训练跨集群,使得用户能够训练最前沿的模型,并且共同拥有由此产生的开放AI创新成果,包括语言模型和科学突破。

  • Zed:高性能、多人协作代码编辑器

    Zed是由Atom和Tree-sitter的创造者开发的高性能、多人协作代码编辑器,开源且集成了AI代码生成功能。它利用多核心CPU和GPU,实现即时启动、快速文件加载和响应键盘输入。Zed支持GitHub Copilot,并通过内置助手面板与模型进行对话式交互,以生成或重构代码。

  • AuraFlow:开源的基于流的文本到图像生成模型

    AuraFlow v0.1是一个完全开源的、基于流的文本到图像生成模型,它在GenEval上达到了最先进的结果。目前模型处于beta阶段,正在不断改进中,社区反馈至关重要。感谢两位工程师@cloneofsimo和@isidentical将此项目变为现实,以及为该项目奠定基础的研究人员。

  • 墨狐AI:短篇小说写作助手

    墨狐AI是一个专为短篇小说创作者设计的在线写作助手,它通过提供创意大纲、续写故事、生成剧情树和剧本创作等功能,帮助作者激发灵感,提高写作效率。产品背景信息显示,墨狐AI旨在解决创作者在创作过程中遇到的难题,如灵感枯竭或故事发展困难。目前,墨狐AI的定位是辅助工具,详情可访问官网查看更多介绍。

  • LLaVA-NeXT:大型多模态模型,处理多图像、视频和3D数据。

    LLaVA-NeXT是一个大型多模态模型,它通过统一的交错数据格式处理多图像、视频、3D和单图像数据,展示了在不同视觉数据模态上的联合训练能力。该模型在多图像基准测试中取得了领先的结果,并在不同场景中通过适当的数据混合提高了之前单独任务的性能或保持了性能。

  • 老鱼简历:在线制作简历,简单高效。

    老鱼简历是一个在线简历制作平台,提供多种简历模板,支持AI生成简历,帮助用户快速制作出专业且个性化的简历。用户可以根据自己的需求选择不同的模板,并通过简单的在线编辑完成简历的制作,支持下载为PDF或PNG格式,满足不同场景的求职需求。

  • Enchanted:与私有自托管语言模型对话的iOS/macOS应用

    Enchanted是一个开源的、兼容Ollama的macOS/iOS/visionOS应用,它允许用户与私有自托管的语言模型如Llama 2、Mistral、Vicuna等进行对话。它基本上是一个连接到私有模型的ChatGPT应用界面。Enchanted的目标是提供一个产品,允许在iOS生态系统(macOS、iOS、Watch、Vision Pro)的所有设备上提供无过滤、安全、私密和多模态的体验。

  • Logo Galleria:在线AI Logo制作,快速生成个性化标志。

    Logo Galleria是一个在线AI Logo制作平台,利用人工智能技术帮助用户快速生成个性化的标志设计。它通过用户输入的行业、风格等参数,提供定制化的标志设计方案,满足不同用户的设计需求。该平台的主要优点是操作简便、设计效率高,可广泛应用于品牌建设、产品包装等场景。

  • Afforai.com:AI驱动的参考文献管理助手

    Afforai是一个AI驱动的参考文献管理助手,旨在帮助研究人员管理、注释、引用论文,并以AI的可靠性进行文献综述。它提供了一个全新的研究材料存储方式,使用户能够专注于真正重要的事情。Afforai支持多种文档格式,包括DOI、URL、PDF等,并具有多种搜索模式,可以连接数百篇论文进行总结、比较和翻译。此外,Afforai还提供数据引用,使用户能够方便地核实信息来源,确保研究的可靠性。

  • Rodel Agent:集成聊天、文本转图像、文本转语音和机器翻译的桌面应用

    Rodel Agent 是一款集成了聊天、文本到图像、文本到语音以及机器翻译功能的Windows桌面应用程序。它支持当前主流的AI服务,为用户提供了卓越的桌面AI体验。该产品的主要优点包括强大的集成功能、用户友好的界面以及对主流AI服务的支持,能够显著提高用户的工作效率和创造力。

  • DictionaryByGPT4:一本由GPT4生成的英语单词书,覆盖8000+单词

    DictionaryByGPT4是一个由GPT4模型生成的英语单词学习工具,它通过分析超过8000个单词,为每个单词提供词义、例句、词根词缀、变形、文化背景、记忆技巧和小故事等全方位信息,帮助用户深入理解单词的来源、使用场景以及记忆方法。该产品特别适合需要提升英语词汇量和理解力的学习者。

  • gpt-frontend-code-gen:前端页面生成神器,提升开发效率

    gpt-frontend-code-gen 是一个基于 React 和 Vite 构建的前端项目,结合 Koa 后端服务,实现前端页面生成并预览的功能。它使用 GPT-4 模型,支持 Chakra UI 和 ShadcnUI 组件生成,允许开发者通过对话形式持续迭代和修改页面,直到达到满意的效果。

  • OpenDiLoCo:开源实现分布式低通信AI模型训练

    OpenDiLoCo是一个开源框架,用于实现和扩展DeepMind的分布式低通信(DiLoCo)方法,支持全球分布式AI模型训练。它通过提供可扩展的、去中心化的框架,使得在资源分散的地区也能高效地进行AI模型的训练,这对于推动AI技术的普及和创新具有重要意义。

  • SmartCrawl:将任何网站转化为AI驱动的API。

    SmartCrawl是一个创新的在线工具,它允许用户将任何网站转化为API,通过AI技术实现数据的自动化抓取和处理。这项技术对于需要从网站获取数据的开发者和企业来说非常重要,因为它简化了数据集成的过程,提高了效率。产品目前处于Beta测试阶段,用户可以通过加入等待名单来获取试用机会。

  • TF-ID:学术文献中表格和图表的识别工具

    TF-ID是一个由Yifei Hu创建的用于从学术论文中提取表格和图表的对象检测模型系列。这些模型基于microsoft/Florence-2检查点进行微调,提供带或不带标题文本的版本,旨在提高学术文献信息的可访问性和处理效率。

  • FlashAttention:快速且内存高效的精确注意力机制

    FlashAttention是一个开源的注意力机制库,专为深度学习中的Transformer模型设计,以提高计算效率和内存使用效率。它通过IO感知的方法优化了注意力计算,减少了内存占用,同时保持了精确的计算结果。FlashAttention-2进一步改进了并行性和工作分配,而FlashAttention-3针对Hopper GPU进行了优化,支持FP16和BF16数据类型。

  • aTrain:一款用于离线语音转录的GUI工具

    aTrain是由格拉茨大学商业分析与数据科学中心的研究人员开发,并由格拉茨知识中心的研究人员测试的一款离线语音转录工具。它利用最新的机器学习模型,无需上传任何数据即可自动转录语音录音。aTrain在《行为与实验金融学杂志》上发表的论文中被介绍,如果用于研究,请引用该论文。它支持Windows 10和11系统,用户可以通过Microsoft应用商店或BANDAS中心网站下载安装。对于Linux系统,提供了Wiki上的安装指南。aTrain的主要优点包括无需上传数据的隐私保护、高质量的转录质量、以及在本地计算机上的快速处理速度。

  • Graphcore:AI加速器,推动人工智能的突破

    Graphcore是一家专注于人工智能硬件加速器的公司,其产品主要面向需要高性能计算的人工智能领域。Graphcore的IPU(智能处理单元)技术为机器学习、深度学习等AI应用提供了强大的计算支持。公司的产品包括云端IPU、数据中心IPU以及Bow IPU处理器等,这些产品通过Poplar® Software进行优化,能够显著提升AI模型的训练和推理速度。Graphcore的产品和技术在金融、生物技术、科研等多个行业都有应用,帮助企业和研究机构加速AI项目的实验过程,提高效率。

  • SandTech:企业级AI和数据解决方案提供商

    Sand Technologies提供企业级AI和数据解决方案,帮助公司解决实际商业问题并实现有意义的结果。公司已在该领域深耕十年,开发定制AI算法和模型,构建在可大规模管理数据的平台和基础设施上。

  • Melodisco.so:AI 音乐播放器智能推荐,发现你的音乐新世界

    Melodisco是一个基于人工智能技术的音乐播放器,通过智能推荐算法,为用户提供个性化的音乐播放体验。它能够根据用户的喜好和听歌习惯,推荐适合的音乐,帮助用户发现新的音乐风格和艺术家。产品背景信息显示,Melodisco致力于为用户提供一个全新的音乐探索平台,无论是音乐爱好者还是寻找灵感的创作者,都能在这里找到适合自己的音乐。目前产品提供免费试用,具体价格和定位信息未在页面上明确展示。

今日大家都在搜的词:

热文

  • 3 天
  • 7天