首页 > 业界 > 关键词  > Genspark最新资讯  > 正文

AI日报:前百度高管推AI搜索产品Genspark;Kimi内测上下文缓存功能;TikTok推AI全家桶Symphony;橙篇已支持10万字长文生成

2024-06-20 14:27 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、前百度高管景鲲创业AI搜索估值18亿 推出首款产品Genspark

作为前百度高管,景鲲创立了新公司MainFunc并推出首款产品Genspark,旨在通过AI技术提供优质搜索体验。公司获得6000万美元种子轮融资,估值达到2.6亿美元,展现出巨大市场潜力。景鲲的履历卓越,现在再次领先AI搜索领域,期待其继续创新发展。

image.png

【AiBase提要:】

🚀 MainFunc是由景鲲和前小度CTO朱凯华共同创立的AI创新产品公司,推出首款AI Agent搜索产品Genspark。

💰 公司完成6000万美元的种子轮融资,估值达到2.6亿美元,市场潜力巨大。

🔍 Genspark定位为AI Agent引擎,专注提供搜索服务,通过AI技术生成名为"Sparkpages"的自定义页面,节省用户时间提供可信信息。

官网地址:https://mainfunc.ai/

搜索产品入口:https://top.aibase.com/tool/sparkpage

2、Kimi 开放平台将启动 Context Caching上下文缓存 内测

Kimi 开放平台近日宣布,备受期待的Context Caching功能即将启动内测。这一创新功能将支持长文本大模型,并通过高效的上下文缓存机制,为用户提供前所未有的体验。Context Caching是一项前沿技术,通过缓存重复的Tokens内容,大幅度降低用户在请求相同内容时的成本。

微信截图_20240620091624.png

【AiBase提要:】

🔑 Context Caching功能支持长文本大模型,通过高效的上下文缓存机制提供前所未有的体验。

🚀 Context Caching能智能识别并存储已处理的文本片段,极大提升API接口响应速度。

💡 适用于规模化、重复度高的prompt场景,通过重用已缓存的内容提升处理效率、降低费用。

3、TikTok推AI全家桶Symphony 写脚本,剪视频,数字人全包

TikTok推出的Symphony AI内容工具套件彻底改变了内容创作和分享方式,让每个人都能成为创意大师。Symphony Assistant提供贴心的帮助,发现趋势、提供创意指导、激发灵感、编写脚本,并给出优化建议。Symphony Creative Studio能在60秒内生成多种TikTok视频预览,支持多语言翻译和视频编辑。Symphony Digital Avatars帮助品牌扩展创意策略,提供真实人物头像。

【AiBase提要:】

🚀 Symphony Assistant提供全方位创作帮助,从趋势发现到脚本编写,让创作过程更简单高效。

💡 Symphony Creative Studio支持快速生成多样TikTok视频预览,多语言翻译和视频编辑功能让内容更具吸引力。

👤 Symphony Digital Avatars通过生成式AI创建真实人物头像,帮助品牌扩展全球创意策略。

详情链接:https://www.tiktok.com/business/en-US/blog/tiktok-symphony-ai-creative-suite

4、百度文库:AI产品“橙篇”已支持10万字长文生成

百度文库最新推出的AI产品“橙篇”在长文生成和多模态编辑方面取得重大突破,为用户提供全面的创作和编辑功能。产品基于强大的AI技术支持,让用户能够轻松访问专业学术资源、创作超长图文内容,并实现一站式的多格式编辑和调整。

image.png

【AiBase提要:】

🚀 “橙篇”支持10万字长文生成及多模态编辑能力,满足用户专业领域内的全链路需求。

💡 打破学术资源壁垒,让用户轻松访问全球专业学术站点资料和文献资料。

✨ 支持超长图文理解和生成,一次性上传多种格式文件并实现快速总结、问答和创作。

详情链接:https://top.aibase.com/tool/chengpianai

5、首个AI高考评测结果发布 GPT-4o拿下第二名

在这场别开生面的AI高考评测中,多个AI模型接受了语文、数学和英语的全面能力测试,展现出了在学术领域的潜力和局限性。虽然在语文和英语科目表现良好,但在数学推理方面仍有提升空间。未来随着技术的进步,AI将更加聪明,更好地服务人类社会。

【AiBase提要:】

🧠 AI模型参与全面能力测试,展现学术潜力和局限性。

📚 语文和英语科目表现良好,数学推理方面仍有提升空间。

🚀 技术进步将使AI变得更加聪明,更好地服务人类社会。

6、Flash Diffusion适用于任何扩散模型,实现几步图像生成

Flash Diffusion方法为图像生成技术带来革命性突破,加速了预训练扩散模型生成过程,表现出色且高效多才多艺。研究人员采用可调整的分布和对抗目标等创新手段,提高预测模型定位和计算效率。该方法适应不同骨干网络,显著减少采样步骤同时保持高质量生成。Flash Diffusion注入新活力,提升图像生成效率和多功能性,有望在各领域产生深远影响。

image.png

【AiBase提要:】

⚡ 加速预训练扩散模型生成过程,表现出色且高效多才多艺。

🔍 采用可调整的分布和对抗目标等创新手段,提高预测模型定位和计算效率。

🌟 适应不同骨干网络,显著减少采样步骤同时保持高质量生成。

详情链接:https://top.aibase.com/tool/flash-diffusion

7、AI生图可“量身定制”!华为清华联手推个性化生成技术PMG

在个性化至上的时代,华为与清华大学合作推出了名为PMG的个性化生成技术。该技术利用用户历史行为和偏好,生成符合用户需求的多模态内容,如表情包、T恤设计图、电影海报等。通过实验验证,PMG技术展现出巨大潜力和商业价值,为用户带来更加丰富、个性化的体验。

image.png

【AiBase提要:】

⚙️ PMG技术利用用户历史行为和偏好生成个性化多模态内容。

💡 PMG通过关键词生成和隐向量生成提取用户偏好,实现多模态内容生成。

📈 PMG技术在电商服装图片生成、电影海报场景和表情生成等应用场景中验证有效性,展现出色的生成效果。

详情链接:https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG

8、Gboard革新打字体验 谷歌凭大模型实现一键修复所有错误

Gboard是Google为移动设备打造的智能键盘,最新推出的"校对"功能利用大型语言模型实现一键修复整个句子和段落错误,彻底改变了传统的逐字修正体验。该功能已在Pixel8设备上推出,受益用户众多。研究团队通过复杂的错误合成框架生成模拟数据集,结合监督学习和强化学习技术优化模型性能,展示了大模型在提升移动端输入交互体验方面的巨大潜能。

【AiBase提要:】

🔍 利用大型语言模型实现一键修复整个句子和段落错误,改变传统逐字修正体验。

🚀 通过复杂的错误合成框架生成模拟数据集,结合监督学习和强化学习技术优化模型性能。

💡 部署在云端TPU V5上,通过优化延迟等手段提升用户输入效率。

详情链接:https://arxiv.org/abs/2406.04523

9、可以在Confyui中用英伟达的Lumina-T2X图像生成了

英伟达的 Lumina-T2X 图像生成模型可以在Confyui中用英伟达的Lumina-T2X图像生成了,作为一个开源模型,它在美学表现和图像质量上与业界领先的MJ V6 相差无几,这一成就在开源领域尤为难能可贵。

image.png

【AiBase提要:】

🌟 Lumina-T2X采用统一的DiT架构,能生成多种媒体内容,拓展AI在内容创作领域的应用范围。

💡 Lumina-T2I图像生成模型提高生成质量、降低训练成本,展示AI技术的经济潜力。

🔑 Lumina-T2I的成功关键在于模型主干采用Large-DiT、文本编码模型使用Llama2-7B、VAE采用SDXL,为高质量图像生成奠定基础。

感兴趣的可以在 Confyui 中使用这个插件尝试::https://github.com/kijai/ComfyUI-LuminaWrapper

10、OpenAI灵魂人物Ilya创办新AI公司SSI 剑指安全超级智能

Ilya Sutskever离职后创立Safe Superintelligence Inc.专注解决超级智能人工智能系统安全性问题。公司致力于研究控制和限制超越人类智能的AI,并计划通过工程和科学突破解决安全性难题。SSI从一开始就是营利性实体,不受短期商业压力影响,目前正在招聘技术人才。

【AiBase提要:】

🔒 SSI专注解决超级智能AI系统安全性问题,致力于研究控制和限制超越人类智能的方法。

🚀 SSI计划通过工程和科学突破解决AI安全性难题,提高AI能力和安全性。

💼 SSI是一家营利性实体,不受短期商业压力影响,正在招聘技术人才。

11、GPT-4通过图灵测试 超过一半的人无法区分GPT-4和人类

人工智能领域的重要里程碑之一是图灵测试,最近一项实验显示,GPT-4在互动式双人图灵测试中被误认为人类的概率高达54%,引发人们对AI系统逼真表现的关注。参与者更倾向于使用语言风格和社会情感因素来判断对方是否为人类,这对机器智能的讨论产生了深远影响。

【AiBase提要:】

🤖 GPT-4在图灵测试中被误认为人类的概率高达54%,展现出逼真的表现

🔍 参与者更倾向于使用语言风格和社会情感因素来判断对方是否为人类

💡 结果暗示了AI系统在实际应用中可能欺骗人类,提出了新的伦理、隐私和安全性挑战

12、AI设计工具Kittl:输入文字提示即可生成图标、剪贴画等

Kittl是一款AI驱动的设计平台,利用先进算法和机器学习,用户可通过简单文本提示创建高质量设计元素,无需复杂技能和软件操作。提供矢量标志图标、令人惊叹的图像和剪贴画,高级文本编辑,魔法着色,即用型模板。用户可访问插图、字体、照片、图标、纹理等无限内容,轻松拖放并自定义。

【AiBase提要:】

⭐ 利用AI技术和机器学习,用户通过简单文字提示即可创建高质量设计元素。

⭐ 提供成千上万的专业设计模板,无需复杂的设计技能和软件操作。

⭐ 用户可轻松拖放高质量插图、照片、图标和形状,并自定义。

产品入口:https://top.aibase.com/tool/kittl

举报

  • 相关推荐
  • 最强Agent?3分钟看懂Kimi K2真的好用吗?

    Moonshot AI于2025年7月11日发布开源大模型Kimi K2,主打代码编写、数学推理和Agent工具调用功能。该模型采用MoE架构(1T参数,激活32B),在SWE-Bench等测试中表现优异,数学推理得分达97.4。支持128k上下文、工具调用和API集成,定价为输入4元/百万tokens、输出16元/百万tokens。相比闭源模型,Kimi K2具有开源免费、成本低等优势,适合开发者和企业使用。同时推荐AIbase平台,可系统比较�

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • TikTok电商抢滩日本,有哪些机遇和挑战?

    ​TikTok电商全球化布局再落一子。 6月30日,TikTok正式在日本上线电商业务,核心模式为直播带货。品牌、卖家及创作者可通过发布含购物功能的视频或直播,在TikTok内直接销售商品。 在东南亚、美区等市场,TikTok电商已证明了其直播带货模式的爆发力。如今全球化布局再下一城,给从业者带来了哪些新的机遇和挑战? TikTok Shop在日本上线 早在4月28日,TikTok日本正式宣布推出

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 轻薄多彩 强悍耐用 | TECNO正式发布SPARK 40 系列

    传音旗下TECNO发布全新SPARK40系列手机,包含四款机型,主打轻薄机身与旗舰级配置。全系配备6.78英寸144Hz AMOLED屏、5200mAh大电池及45W快充,Pro+机型厚度仅6.49mm,支持30W无线充电。搭载联发科Helio G200处理器,安兔兔跑分近47万,配备5000万主摄和EIS防抖。AI方面整合ChatGPT等平台,支持离线通信功能。通过IP64防水防尘认证,采用抗摔玻璃,重新定义中端机性能标杆。

  • 最重要的搜索阵地,百度想誓死守住

    AI搜索的东风刮过两年,百度终于下决心,对自家搜索引擎“动刀子”。 7月2日,百度宣布开启十年来最大一次搜索改版,正式将搜索框改版成支持千字输入的“智能框”,从“给链接”跨越到了“给答案”。另外靠着智能体,百度搜索也进入了“解决任务”的阶段,并集成了AI写作、AI图片/视频生成等一系列服务。 当然,这还不够。在阿里夸克、字节豆包等产品不断往自家�

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • AI日报:百度发布“绘想”平台与MuseSteamer;阿里音频驱动全身数字人模型OmniAvatar

    【AI日报】今日AI领域重要动态:1.开源语音大模型Step-Audio-AQAA发布,实现音频到语音的端到端自然转换;2.百度推出"绘想"平台与MuseSteamer,通过AI一键生成专业级视频;3.浙大与阿里联合发布OmniAvatar,音频驱动数字人技术取得突破;4.百度搜索迎十年来最大改版,新增智能框、百看和AI助手功能;5.xAI开发者控制台新增Grok4及Grok4Code引用,预示新一代AI模型即将发布;6.Gemin

  • 苹果Mac全家桶下半年登场:首发M5芯片

    据报道,苹果将从今年下半年开始陆续更新Mac系列产品线,包括MacBook Air、MacBook Pro、iMac、Mac mini、Mac Studio和Mac Pro。 根据曝光的信息,全新Mac系列产品线首发搭载苹果M5系列芯片,其中iMac、MacBook Air 13和15英寸搭载M5标准版。 Mac mini、14英寸MacBook Pro、16英寸MacBook Pro搭载M5 Pro芯片,14英寸MacBook Pro和16英寸MacBook Pro还有M5 Max版本可供选择。 据悉,苹果M5系列芯片基于台积电先进的

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。