首页 > 优化 > 关键词  > seo最新资讯  > 正文

长尾关键词的批量自动获取思路及实现

2012-08-06 11:46 · 稿源:seozzj.com

以百度为例,思路如下:

1、搜索主关键词,分析相关搜索链接,存入网址库,标记为未抓取。

2、读取数据库中标记为未抓取的网址,抓取后分析相关搜索,存入网址库,标记为未抓取。

3、重复2直到指定深度(一般热门关键词6层左右深度差不多全部读取,一般关键词4层即可,理论上可以无限层,但需要抓取的数据量呈级数增长,相关性也越来越差,没必要)。

4、人工处理长尾词,这里需要人工去除一些无关的关键词,保留合适的(当前搜素引擎的语义处理能力还很弱)。

至此,基本完成了对长尾关键词的处理,可以获得一个比较全的长尾关键词列表了。由于个人还需要研究不同层次关键词之间的关系,所以存储了搜索结果的网页,定义了父子关系,也没有过滤不同层之间相同的关键词,这些对找长尾词用处不大。

自动获取文件指定目标关键词的php实现见附件:spider_keywords

这是我自用程序,提供一个实现方式,打算用的话还需要根据自己使用环境修改,要求懂php,SQL。关键部分如相关关键词分析提取已经做的比较稳定,请放心使用。其中:

mykeyword.dat为存放关键词的文件,每行一个主关键词。

$depth为抓取深度,默认5层,对于一般关键词够深。

程序挖掘数据后存放在我的PostgreSQL数据库,数据库默认UTF-8编码,可以根据自己的实际需要修改。数据表结构如下:

– Table: mykeywords

– DROP TABLE mykeywords;

CREATE TABLE mykeywords

(id serial NOT NULL,

father text,

"content" text,

sons text,

depth text,

keyname text,

remark text,

is_spidered boolean,

CONSTRAINT mykeywords_pkey PRIMARY KEY (id)

)

WITH (OIDS=FALSE);

ALTER TABLE mykeywords OWNER TO postgres;

本文由seo蜘蛛站长所写,出处:https://www.seozzj.com/seo-tips/long-tail-keywords-bulk/ 转载请注明!

举报

  • 相关推荐
  • 如何找到真正好用的AI工具?一个优质导航站是关键!

    文章探讨了AI工具爆炸式增长带来的信息过载问题,指出盲目试错会浪费大量时间。重点介绍了AIbase工具导航站的核心价值:1)精准分类直达需求场景;2)严格筛选确保工具质量;3)高频更新追踪前沿动态。该平台通过深度垂直分类、多维筛选机制和实时更新系统,帮助用户快速定位适合中文创作、图像生成等特定需求的AI工具,显著提升工作效率。文章强调在AI时代,专业导航平台能有效解决信息碎片化问题,是探索AI世界的效率入口。

  • 轻食正在发生几个关键变化

    所有餐饮都可以用健康化的方式再做一遍。 因为健康化是个确定的大趋势。从瓶装饮料的0糖0脂0卡、无糖茶到翻遍本草纲目的中式养生水,从茶饮的轻乳轻卡、到主打超级原料的山野果蔬茶,再加上零售企业对烘焙熟食的制售升级,消费者健康意识的触角已经伸向了从食材到配料,从加工到现制的方方面面。 相比于在小吃小喝上提高健康意识,更为日常的一日三餐理论上更�

  • 男子吃海鲜火锅后感染甲肝 医生提醒:煮熟海鲜是关键

    ​近日,一位来自内陆城市的老人强伯(化名)在探亲期间,因品尝了沿海城市特色的排档式自助海鲜火锅而不幸感染了甲肝病毒。据强伯的女儿介绍,为了让远道而来的父亲体验当地美食,她特意带他去了福州一家知名的自助海鲜火锅店。面对琳琅满目的海鲜,强伯兴奋不已,尽情享受了这顿丰盛的海鲜大餐。 然而,好景不长,火锅吃完没多久,强伯的身体就出现了异常。

  • 瞄准关键人群,这个品牌跑出双11“十一连冠”,拿下两个行业第一

    13年深耕,袋鼠妈妈如何从一个专注母婴领域的品牌,不到一年时间,在一个全新赛道上再次实现领先? 对于袋鼠妈妈集团总裁潘美红而言,“妈妈”身份并不影响她开创了一番事业天地。在她的微信签名里,至今仍有一句话:“幸福是奋斗出来的。”在为“妈妈们”这一角色奋斗的路上,她的经历也与时代浪潮暗合,上世纪90年代初的中国创业潮,正是她事业的起点。 在当时�

  • 创新药行情是否可持续?诺安基金唐晨解析投资关键在“什么不变”

    近期创新药板块在资本市场表现亮眼,成为投资者关注焦点。数据显示,创新药板块领涨市场,港股创新药板块屡创新高,恒生创新药指数今年以来涨幅超93%。政策面上,国家出台16条措施支持创新药发展。多家药企中报业绩预增,CXO板块趋势向好。中国创新药海外授权交易成绩斐然,2025年上半年总金额近660亿美元。诺安精选价值基金凭借前瞻布局脱颖而出,基金经理唐晨专注生命科学领域投资,二季度保持高仓位运作,聚焦医疗保健板块。该基金过去六个月净值增长率达61.88%,大幅跑赢基准。中国创新药在政策、资本与技术三重共振下迎来"黄金十年",正重构全球医药版图。

  • 百瑞纪刘海文:存量资产活化的三大关键与租赁住房的未来趋势

    百瑞纪集团副总裁刘海文在第八届中国住房租赁产业高峰论坛上,围绕"存量资产突围"主题发表演讲。他指出,过去三年住房租赁行业经历显著调整,部分项目净收益下滑10%-30%,传统包租模式面临挑战。但行业正进入更规范化、专业化发展阶段,竞争关键转向通过精细化运营提升资产价值。刘海文提出三大核心策略:1.理性看待市场波动,关注长期稳定收益;2.优化经营策略,采用浮动租金或收益分成模式;3.加强合规风险管理。未来趋势包括大型租赁社区成为主流、数字化运营普及及政策持续支持。百瑞纪将继续以"运营+资管"双轮驱动战略,推动行业高质量发展。

  • 从SEO到GEO:源易信息揭示AI时代品牌增长的确定性

    上海源易信息科技在2025年7月25日举办的CMO闭门训练营上,提出生成式引擎优化(GEO)概念,指出传统SEO模式面临挑战。数据显示,国内生成式AI平台流量爆发式增长,预计2026年25%搜索流量将转向AI工具。源易信息定义GEO为针对AI生成内容优化的新营销范式,通过"提示词策略师"工具和"LLMs Friendly"内容三步法,帮助品牌在AI时代构建可持续流量护城河。多个案例证明GEO能显著提升品牌在AI回答中的采纳率,如某腕表品牌在行业关键问题查询中获得权威推荐。源易信息作为中国GEO领域先行者,已发布行业首份白皮书,引领营销进入AI新纪元。

  • 腾讯公司副总裁蔡光忠:从好技术到好产品,AI进入场景突破关键期

    腾讯副总裁蔡光忠在2025世界人工智能大会上表示,AI发展正从"能用"向"好用"转变,未来竞争焦点将从模型规模转向实际应用价值。腾讯通过混元大模型等技术底座,构建了面向不同用户的智能平台体系,包括面向开发者的腾讯云智能平台、面向个人用户的元器平台等。目前腾讯AI已在政务、金融、教育等多个行业落地应用,形成可复制的标杆案例。蔡光忠强调,

  • 卖家精灵参与亿邦动力跨境微访谈:Prime Day现“冰火分化”,AI精细化运营成旺季破局关键

    亿邦动力分析7月跨境电商年中大促呈现结构性特征:亚马逊Prime Day首日因流量集中导致平台短暂宕机,次日流量显著回落;广告CPC成本上涨,秒杀效果不及预期。面对下半年旺季,卖家需结合AI工具精细化运营。卖家精灵推出AI市场洞察系统,帮助卖家选品运营;同时联合讲师打造亚马逊实战课程。数据显示,国货出海与产业带转型卖家增多,中东、澳洲等新兴市场受关注。卖

  • AI大模型对比完全指南:如何选择最适合你的大模型?

    文章探讨了当前AI大模型市场众多选择带来的选择困难问题。面对GPT-4、Claude、文心一言等各具特色的模型,普通用户和企业难以科学评估和选择。文章提出了一套完整的评估体系,包括基础能力、技术性能、应用场景和商业考量四个维度,并建议采用标准化测试和实际场景验证相结合的方法。同时介绍了2025年主流AI模型的特点:GPT-4o在多模态交互领先,Claude3在编程和逻辑分析突出,Gemini2.5擅长长文本处理,国产DeepSeek则以高性价比见长。最后强调选择AI模型应基于具体需求,而非简单追求性能排名,建议通过专业对比平台和实际测试来验证。