如今seo纯采集站还能存活吗?【经验总结】

小F 0

最近,一位做纯采集站长和我聊了很久。最终得出了以下总结。一些是关于SEO,一些是关于采集和运维的基础个人见解。请只作分享,自行分辨好坏,实践才真理。

如今seo纯采集站还能存活吗?【经验总结】

是原创的还是采集比较好?


这不用说大家都知道当然原创比较好。百度是这么说的,谁叫人裁判?

★为什么我的原创文章,还是不收录?收录了也没排名?

是一个搜索引擎,其中心价值是为用户提供最需要的结果。搜索引擎统计了网民的需求,对于网民需求较少或需求较少的内容,即使是原创内容,也可能被搜索引擎忽略。为什么这么说,是因为我不想把资源浪费在无意义的内容上。

网民需求高的内容应该收录多、速度快,但正因为收录多,即使是原创的内容也可能很难挤进排行榜。

搜索引擎统计信息用户的需求用什么来标识?

关键词。当每个人搜索关键字时,他/她表示对与这句话相关的内容有需求。然后,使用搜索引擎的人通常会问q&;有a需求,搜索查询需求。当然,搜索引擎内部一定有非常庞大的分析系统。要准确确定这些需求,请参阅百度指数。例如,如果搜索的关键词是“手机”,你很可能想购买手机或查询某个价格,你可能只是想下载漂亮的壁纸。但是,如果想要壁纸的话,就会有更准确的关键词“手机壁纸”,以下拉框和相关搜索的形式显示。

既然原创好,为什么要采集?


●原创好,只要方法得当,采集效果不会比原创差太多,比没有掌握方法的原创好得多。

精力有限,原创难以保证长期大量更新,聘请编辑可能导致投入产出比负。

★市面上的采集软件这么多,该用哪个?

每个采集软件都有其独特之处,所谓存在是合理的。请根据您的需求进行选择。我的采集软件是自己开发的。在开发过程中考虑了以下几点。使用其他采集软件的人也可以参考。

直接提供分类庞大的关键词。这些关键词都是百度已经统计出的有网民需求的词(有百度指数),或者是这些词的长尾词,来自百度下拉框或相关搜索。

直接按关键词收集,智能分析和捕获网页正文。没有必要自己写收集规则。

抓取的正文按规范标签整理,段落均

将显示标签,并删除所有乱码。

如果根据收集到的内容自动绘图,图像与该内容的关联度一定非常高。这样代替伪原创,不影响可读性,把文章整理成文章,比原始提供的信息更丰富。5.正文中的关键词自动加粗,插入的关键词也可以定制。但是,没有语句排序、段落排序等影响可读性的所谓“伪原创”功能。

可以直接使用关键字及其相关短语作为标题,也可以抓住所需网页的标题。

可以收集微信文章。

不用触发或挂机。

整合百度站长平台积极推送,加快收录。

织梦、WordPress、dz、zblog、帝国cms或其他不同的网站后台程序对SEO有什么影响?


理论上没有影响。因为搜索引擎不会因为你是什么程序,或者你可以通过一些规则识别它,程序本身的不同而影响你的判断。

那是什么影响SEO呢?答案是模板。基本上,这些程序都具有模板机制,因此模板可以在同一程序中输出不同的页面,而在不同的程序中也可以输出同一页面。模板确定后,每个页面都将根据此框架输出。也就是说,整个html结构是确定的。这些html是搜索引擎所关注的,必须从这些html中获得必要的信息。因此,一套好的模板非常重要。

★模板设计应注意的细节是什么?

权重结构顺序。在整个页面的html中(请注意,这是html而不是显示的布局),权重越高。从那里引申出来,“title”、“keyword”、“description”三个标签,由于位于最高位,所以权重最高。其次是导航,基本上是最上面的,权重也非常高。再次是文章的标题和正文。这是根据html前后进行排序的。

因为搜索引擎首先遵循W3C标准,所以W3C中定义的一些原本是用于表示重要信息的标签,并且权重当然很高。例如,特别是h1用于表示当前页的最重要的信息,并且通常一个页只有一个信息,其权重对应于title,并且通常用于放置当前页的标题。当然,为了提高首页的权重,有时也会在h1上放置徽标或指向首页的链接。另外,为了表示强调,还有em和strong的标签。一般认为strong的权重高于标签,同样作用较粗,但从SEO的观点来看,权重没有加强。

css或js代码对搜索引擎通常没有意义,应尽可能使用其他文件进行存储,或在允许的情况下放在html末尾网站结构规划中应注意的问题是什么?

网站结构规划应该注意哪些问题?

网址设计。URL也可以包含关键字。例如,你的网站是关于电脑的,你的URL可以包含“PC”。这是因为在搜索引擎眼里通常和“电脑”是同义词。URL不要太长。分层尽量不要超过4楼。这到此为止。

专栏设计。专栏通常与导航有关,设计时应考虑整个站点的主题、用户可能对哪些内容感兴趣。列名称是站点的几个主要关键字,这有助于利用导航权重。

关键词布局。理论上所有内容页面都应该有其中心关键词,同一栏目下的文章应该尽量围绕栏目关键词展开。一个简单粗暴的方法是直接使用栏目关键词长尾词。

★动态、伪静态、静态,这三个中哪个好?

虽然这不能一概而论,但建议使用伪静态或静态。这三个区别在于是否生成静态文件以及URL格式是否为动态。生成静态文件,本质上是为了提高访问速度,减少数据库查询,但占用空间不断增加,模拟只是通过URL改写修改URL,实际上还是每次都通过程序运算,查询数据库后再修改页面动态和伪静态的区别只是URL,带有问号和参数。

所以,关注两点就好了。网站的开放速度足够吗?需要节省服务器空间吗?

数据库操作的效率可能因网站上的程序而异。通常,如果内容页数在1万以内,则页面打开速度相对较快,数据量可能为5万、10万或更大,并且必须考虑静态化。

★提高访问速度的方法是什么?

已经提到的静态化。

许多站点模板通常随机调用文章,或有类似的块。事实上,随机对数据库来说是一个比较大的负担,模板应该尽量减少对随机文章的调用。如果不可避免,请考虑从数据库进行优化。通常,对具有索引的字段进行排序要比没有索引时快得多。

将图片、js、css等不经常修改的文件放在专用静态服务器上,多个js或多个css可以合并的尽量合并为一个文件,减少http连接次数。

使用各种云加速产品。在普通网站上,免费的百度云加速和360云加速也很好。

文章很多,网站是静态打开的,每更新一次全站需要很长时间吗?

我的做法是使用缓存机制。这里只提供了一种想法。可能需要自己进行二次开发。网站是伪静态设置的,每当每个请求到达时,程序都会检查是否存在相应的缓存html文件,并在生成该文件的时间为几小时或几天前确定需要更新。在这种情况下,它执行常规流程,程序查询数据库,生成html,然后写入缓存文件并输出到客户端。

下一次访问到达时,例如1分钟后再次访问同一页面,再次检查缓存文件的时间。在时间上可以判断为文件非常新,即使完全不更新,也可以直接读取文件的内容并输出到客户端。这将自动生成各个页面,只有第一个访问者感到速度很慢,以后访问者访问时相当于静态访问,速度非常快。

对于独立服务器,也可以考虑自动检测服务器负载。负载本来就较高时,即使判断为需要更新,也将暂时不更新而直接输出。

图片是引用远程网站比较好,还是放在自己的服务器上比较好?

这也各有优劣。浏览远程站点可以节省自己的带宽,但由于对方的服务器很慢、存在删除资源和防盗链,因此很可能看不到图像。下载到自己的服务器上,当然可以自己控制一切,但图像占用的空间非常大,可能比整体静态生成的空间要大。另外,访问量大时,图像最占用带宽。

网站链应该如何优化?


内链是百度政府推荐的优化手段之一,所以这是一定要做的。通常,正文中的关键字会出现,并链接到该关键字,以指向另一个正好与该关键字相关的内容的页面。因此,产生了所谓的最优化方法,通过在正文中强行插入关键字和链接,进行拥挤般的操作。另外,为了提高首页的权重,我认为可以到处登载网站名称,制作首页的链接,提高目标网页的权重。然而,由于搜索引擎计数每个链接的点击率,它们很可能是相反的。放在显眼的位置点击也不多的链接可能被判定为非法。所以,请只在正文中原本就有的关键词上做内链。很好。

段落排序、句子排序、同义词替换等伪原创手法是否可行呢?

不好。由于搜索引擎已经具有智能,所以它自然地进行语义分析,而不是简单的数据库搜索。详情请搜索“NLP”。因为可以判断语义分析困难的句子和段落的可读性差,所以我觉得这些“伪原创”可能是自作自受。

评论模块基本上没人用,要还是不要?

拜托了。评论模块中最头疼的是垃圾评论。通常,真正发言的访问者很少,垃圾评论堆积如山,整天与营销软件斗智斗勇。这里提供我已经实现的方案,可能有助于收录(没有根据的,只是推测)。保留评论框,但禁止评论。所有评论都是由自己的网站程序生成的。前面提到的搜索引擎会做自然的语义分析,其中一个重要的能力就是情感判断。搜索引擎计算每个评论的情感值,并判断是正面(positive)还是负面(negative),具体趋势是10)还是90)。如果评论内容表达了正面情绪,则可以为正文加分,反之则为减分。关于如何自动生成积极的评论,让八仙跨海各显神通吧。

这是网络社会发展后的必然趋势,这样反映了一页的用户体验度。同样地分享、称赞等,原理相似。

绿萝卜算法之后,外链到底还有没有用?

有用。请参阅搜索引擎三定律的相关定律。既然是规律,就不会改变。谁的内容被引用得多,谁是权威?在积极推送出现之前,外链应该是蜘蛛了解页面内容的第一条渠道。

★外链必须是锚文本还是裸链?

不。搜索引擎起着重要的作用,必须努力发现真正有价值的东西,排除没有价值的东西。所以,可能没有收录你直接提交的链接。在别人那里随便发了纯文本网站,被它发现了,加分也算了。

除了锚文本和裸链,还可以通过关键字站点的形式发送纯文本。这样,URL前面的关键字会自动与该URL相关联。

还有一些链接具有nofollow属性,但在百度上计算外链时会进行计算。

★收录和索引到底是什么关系?

表示蜘蛛抓取并分析了。索引表明蜘蛛分析后,认为内容有一定的价值。只有进入索引的内容才会显示在搜索结果中并显示给用户。也就是说,只有索引的内容才有机会带来流量。

快来发表您的意见吧!
  • 全部评论(0
    还没有评论,快来抢沙发吧!