首页 | 网站推广 | 建站资源 | 网站建设 | 域名注册 | 网站维护 | 站长学园 | 站长留言 | 联系方式 | 关于本站 | 站长信息
-
 
 
 
 
特色栏目
网站推广
建站资源
站长学园
搜索引擎收录
蚌埠分类目录
企业网站推荐
bbzz.net 图标

Valid XHTML 1.0!

 
本站旧版
友情链接
站点地图
本站旧版

GOOGLE网站推广之一:谁是GOOGLE.
2005-02-04 04:11:14  By: admin  

    在进行GOOGLE网站推广之前,我们首要弄清的是:谁是GOOGLE. 这篇文章转自中文WIKI,应该能给大家一个很好的解释. iResearch根据OneStat公布的数据整理预测,2004年全球搜索引擎市场Google将达到56.1%,雅虎搜索引擎市场份额将达到21.5%。MSN的搜索引擎使用率排名第三,为9.4%,AOL搜索服务排名第四,为3.7%。紧随其后的是Terra Lycos、Altavista和Askjeeves的搜索服务,市场份额分别为2.3%、1.9%和1.6%。

Google

本文来自维基百科,自由的百科全书

Google是一个位于美国的万维网搜索引擎,是网上最流行的搜索引擎之一,Google公司的搜索引擎网站Google和其客户网站如美国在线那里每天接受2亿次搜索请求。其公司总部位于美国加州圣克拉拉县的山景城(被称为“Googleplex”)。

除了搜索网页之外,Google也提供对图象,存在于Usenet上的新闻讨论组,新闻和在线销售商品的搜索服务。截至2004年11月,Google数据库已经索引了80亿个网页,8亿8千万图象及8亿4千5百万新闻组帖子-总共为95亿。它也缓存了编入索引中的绝大多数网页的内容。

因为Google的名声(也许有80%的网路使用者都使用她),“Google”一个事物做动词表示的是“在Google上寻找某事”。它有宽泛的“搜索网路”的意思。Google官方并不鼓励这种滥用他们公司名字的习惯,因为它可能导致Google变成一个通用商标名。

语源
“Google”这个词来自于“googol”。“googol”一词是由美国数学家Edward Kasner的侄子Milton Sirotta创造的,表示1后面有100个零的数字。Google使用这个词代表公司想征服网上无穷无尽资料的雄心。最初时公司的名字就叫作“Googol”,但是当创办人将该计划推荐给一个投资人Andy Bechtolsheim时,这个投资人寄来的支票上写的收款人是“Google”,为了接收这一张支票,公司的名字由此而来。


Google 周围的万维网Google使用位于世界各地的GNU/Linux服务器场计算机回答搜索要求并索引网页。服务器场被以shared nothing architecture结构建造.索引是由程序“Googlebot”执行的,它会定期地请求访问已知的网页新拷贝。页面更新愈快,Googlebo访问的也愈多。再通过在这些已知网页上的链接来发现新页面,并加入到数据库。索引数据库和网页缓存大小是以兆兆字节(terabyte)来衡量的。

Google使用的这些机器的精确大小和位于何处至今未知,Google官方刻意含糊其词。在John Hennessy和David A. Patterson所着的《计算机建筑:走进大数》中,推测Google的服务器场中群集计算机群形成的“搜寻场”在2000年大约应该有6000个处理器,12000个普通IDE硬盘(即每个机器2个硬盘1个处理器),他们位于四个地方:二个在 硅谷和二个在 维吉尼亚。每个都以OC 48的线路(2488 Mbit/s,参见宽带)连接着因特网并且有一个OC 12(622 Mbit/s)线路连接着其他3个Google分站点。这些连接使用思科12000网关,用二个Foundry Networks BigIron 8000的以太网交换器分流成4 x 1 Gbit/s的线路连接到64个服务器夹,里面前后各是40台电脑和1台惠普以太网交换机,所以一个架子共有80个机器和2个惠普交换机。

Google在2004年4月发布的IPO S-1表单后,大财政公司的英特网开发单位副总裁Tristan Louis估计了现在的服务器场包含下列各项[1] (http://www.tnl.net/blog/entry/How_many_Google_machines):

719个服务器架
63,272台机器
126,544个处理器
253,088 GHz的处理能力
126,544 GB内存
5,062 TB的硬盘空间
依照这一估计,Google服务器场组成了全球最强大的超级计算机,每秒运行速度至少三倍于地球模拟器。

PageRank™和索引
Google惟一被公开过的算法是使用一种自创的称为PageRank™(网页级别)技术来索引网页。该算法根据其他链接到特定网页的加权系数来整理。因此网页级别技术其实是根据由人所建立的链接来编排网页。此前许多与Google一样流行的搜索引擎使用基于关键词的方法来排列搜索结果。这种方法是以搜索关键词出现的次数或相关性来排列最后的搜索结果。先前的那些曾经比Google更流行的搜索引擎只是查看关键字在文中出现的次数或关键字于网页的关联程度。除了网页级别技术外,Google 还有使用其他秘密的标准来决定网页排名的先后。Google创新的搜索技术和典雅的用户界面设计使Google从第一代搜索引擎中脱颖而出。Google并非只使用关键词或代理搜索技术,它将自身建立在高级 PageRank™ (网页级别)技术基础之上。这项专利技术可确保始终将最重要的搜索结果首先呈现给用户。网页级别可对网页的重要性进行客观的分析。用于计算网页级别的公式包含5亿个变量和20多亿个项。网页级别利用巨大的网络链接结构对网页进行组织整理。当从网页A链接到网页B时,Google就认为“网页A投了网页B一票”。Google还对投票的网页进行分析。Google复杂的自动搜索方法可以避免任何人为感情因素。与其它搜索引擎不同,Google的结构设计即确保了它绝对诚实公正,任何人都无法用钱换取较高的排名。Google可以诚实、客观并且方便地找到网上有价值的资料。

Google不但索引并缓存HTML文件, 而且还索引其他12种文件类型, 包括 .PDF,.txt,.doc和.xls。除了文本文件,其他文件的是先转换为HTML版本后缓存的。 所以借助Google可以不需要有这些文件的相应程序就可以看见这些非网页文件,如Word或是Excel。

使用者能自定义搜寻引擎。他们能设定一个缺省语言或使用 "SafeSearch" 过滤技术,设定在每页上被显示的结果多少。Google受争议的放置永久cookie在用户的机器上以储存这些信息,这使他们能够了解过去用户的搜索内容。任何一次搜索请求(只有头10个关键字被查询),每次最多查询头 1000 个结果(以每一页最多100个结果的方式显示)。

尽管它有极大的索引数目,仍然有相当多数量的数据库的数据只能是从网站访问到,而不是借由连接。这所谓的深网暂时不能被Google数据库所覆盖,举例来说包含了图书馆的目录,官方的法定(政府)公文,电话簿等。

(关于 PageRank™ 的介绍,参见Google的PigeonRank™页 (http://www.google.com/technology/pigeonrank.html))


“Google跳舞”和SEO
Google跳舞是一种经常被讨论的现象,Google跳舞指的是Google月底大量更新数据库和算法的几天时间,因为可以发现,这几天对Google搜索关键字如www.yahoo.com得到的结果数是不一样的.

在跳舞期间,一个站点的等级可能在短时间里戏剧般的改变,而且不同的Google服务器(举例来说,www.google.com,www2.google.com,www3.google.com,www.google.co.uk,www.google.com.tw等)可能为相同的关键字提供不同的结果。跳舞似乎当是googlebot机器人抓取网页期间随即发生的。快速更新的网站,高级别的网页和新闻网站是最经常被检查的,虽然新闻不一定如此。小的调节在每月里持续进行以确定网页级别。在一些情况下,可能需要二到三个月让新建页面出现在搜索结果里。从2003年的夏季开始,每月的搜索,索引和等级更新被不见断的持续更新所取代。这种改变大大减少了Google搜索结果的不稳定性。2003年11月15日,Google似乎进行了有史以来最重要的一次算法升级,后来被称为“佛罗里达更新”。在这次更新中,几乎所有商业领域的关键词都受到了影响,尤其是一些热门的关键词,Google搜索的结果页完全变了个样儿,很多头一天还排在首位的网站被远远甩到了500名之后。

Google目前的主要挑战之一是,它的算法和结果越是得到网路使用者的信赖,商业网站为了利益而暗中破坏结果的风险就越戏剧般的增加。一些搜索引擎优化公司已经开始尝试使用各种不同的技巧提升Google网页评级,以使他们客户的网站更多的被搜索到。Google已经设法减少了一些已知的使用这种方法的网站的Google页面评级。

SEO(Search Engine Optimization),即“搜索引擎优化”。由于Google实际上已经成为最流行的搜索引擎之一,很多网站管理员十分热衷于跟踪他们网站在Google上的左侧排名,并试图解释他们排名变化的原因。现在已有不少网站提供排名Google搜索引擎优化服务,如在一些高流量的讨论区内刻意加入商业网站的链接,从而使该网站在Google的排名提高。这种“发明”虽然的确有一定成效,但这种收取客户金钱,在第三者的讨论区上大卖广告,一方面对讨论区的读者造成困扰,也侵害了讨论区的商业利益;这种做法也明显违反了商业道德。

还有一种被普遍采用的技术是很多网站使用一个相同的关键字连接到某一个特定的网站,以使用户在Google搜索这个关键字的时候,这个网站的排名会出现在结果的较前面。这种方法被称为Google炸弹。现在Google算法更新的频率非常快,距猜测,现在算法公式中涉及的变量有300多个,PageRank™在整个Google算法中的影响力已经下降到20%左右,最终平衡的算法中最重要的变量所占的比例不会超过10%,单纯靠技术手段提升排名的网站已经禁不住时间的考验。

Google发布了一系列的文章 (http://www.google.com/webmasters/guidelines.html)以指导站长们合法的提升他们网站的页面评级。

其他的Google服务

Google网上论坛(新闻组)和Google图片搜索服务
Google维护着一个重要的新闻组存档,它被叫做Google网上论坛(即从前一个叫做DejaNews的独立网站)和一个图像搜索服务(被叫做“Google图像”)。前者保存了几十年内几乎所有的新闻组帖子,后者的搜索则是以与图片相关的网页的文本,图片的标题为基础进行的,图片被以合理使用原则缓存进了Google服务器。

Google现在正在尝试一个新版的网上论坛服务,它除了增加新闻组投递功能外还有邮件列表功能,可以使用如类似Gmail这类的接口完成操作。(见下)


Google新闻
Google有一个测试版的自动化新闻服务,2004年9月“Google新闻”包括有美国版,英国版,德国版,法国版,西班牙版,意大利版,新西兰版,印度版,澳洲版,台湾版,韩国版,日本版,中国版和香港版。为了公正客观没有偏见的报到任何新闻,Google新闻的产生是完全由电脑算法决定的,没有人类编辑参与其中。

该服务包括在过去30天内所含语言新闻网站上出现新闻的存档,不同的国家有不同数量的新闻来源;对于英语它包括大约4,500个新闻源,其他语言比较少一些。并且提供新闻的大约头200个字和一个指向全文的连接。一些需要先订阅才能阅读的网站;Google新闻标题中还会有明显的提示信息。

Google新闻提供搜索服务,结果可以以新闻发生日期(这样就不会再对新闻发生的时间感到困扰了)或相关性成类排序(也可以直接分类查看)。在英语版中,有一个可以选择对应国家的选项。

还可以使用关键字订阅Google新闻警报。这样,当与关键字相关的新闻发生时,Google新闻会发出一封电子邮件通知订阅者。

Google新闻服务也可以按来自国家分别查看(跳转至#Google新闻地区连接)


Google网页目录
Google网页目录是一个包括了世界多种语言网页的目录集。在网页目录里面的网页内容一般不会被翻译为其他语言,而总是包括其语言在万维网中的内容的。

网页目录功能与网页搜索是集成的,当搜索网页时,相关网页在目录中的内容会以链接的形式在搜索结果中显现。点击链接就可以找到在同一个目录下相似网页或其它类似分类,这当你不确定到底要找什么时是非常有用的。当搜索范围涵括太广,使用网页目录可缩小搜索于指定范围。例如察看“中文/新闻/杂志”分类子目录,则可知道有哪些中文杂志有网页。网页目录可略去类似但无关的网页。如检索“大学”,将搜索范围设定“教学机构”分类,即可略去像“大学书城”、古书里“大学”、论语的内容.网页目录只包括经编辑群审核过网站。因为网页目录是在开放式目录(Open Directory)工程下运作的。网页重要性排列是网页级别技术及人工的结合。Google还可辨出常用重要网站,排放在目录前面(用粗体字标出)提升网页搜索效率并借由绿线长短表明网页评级。(参见 PageRank™)


Google Answer
2002年4月,Google启动了名为"Google Answers"的新服务.Google Answers是传统搜索功能的扩展-用户不用自己搜索内容,他们请专家搜索然后付费.顾客问问题,并为问题提供一个相应的价钱,然后研究者们回答他们的问题.研究者们经过程序的筛选以测试他们的水平和交际能力.问题的价格从$2到$200不等;Google从中提取25%回扣,剩下的归研究者所有,他们还要付$0.50的列出费.一旦一个问题被回答了,它的答案对所有人就都可以免费浏览了.这个服务在2003年5月开始公共测试.现在大约一天会有100个问题被回答.

Froogle
2003年12月,Google发布了Froogle,一个搜索网页目录上特定产品的副产品.这个站点活跃测试了几个月.现在它也提供无线可标记语言(WML)格式以使得电话或其他支持WML的无线设备可以访问它.

Google Web API
Google Web API(网络应用程序接口或网络服务)是Google为注册的开发者提供的公共接口.使用Simple Object Access Protocol(SOAP,简单对象访问协议),程序员可以依据Google搜索结果开发搜索服务和进行数据挖掘.同样的,网虫们也可以访问页面缓存然后对页面提出建议.

缺省的,一个开发者每天只能有1,000次搜索请求.这个程序仍然处于测试中.Google是很少的几个把其结果通过公共网络应用程序接口公开给大众的搜索引擎;Technorati是另外一个这样做的公司. Google这项服务的一些流行应用包括, Google Alert最新资料快报FindForward (http://www.findforward.com),它同时也是一个调查Google跳舞情况的工具,它监视着Google蜘蛛在万维网上的活动情况.

Google Print
Missing image
Google.Print.png

In August, 2004, Google released its new "Google Print" feature. This tool searches the contents of books submitted by publishers, and displays matches before the regular web matches. It offers links to purchase the book, as well as advertisements related to the content. Google will only allow users to view a limited number of pages from each book. In order to enforce these limits, they will track users of the system. As of early August, 2004, this service is still in beta. This feature is in response to the "Search inside this book" feature from A9.com.

Google Scholar
Missing image
Google.Scholar.png

In November, 2004, Google released "Google Scholar", which indexes and searches academic literature across an array of sources and disciplines. Results are ranked by "relevance", which is based largely on the number of citations and in this sense is similar to PageRank.

Google Special
Allows you to perform special searches such as U.S. Government Search, Linux Search, BSD Search, Apple Macintosh Search, and Microsoft Search.

Google University
Allows you to search certain University sites.

Google Wireless
Allows you to search using Google from wireless devices such as mobile phone and PDAs.

Google Video
2005年1月25日,Google公司推出Google Video (http://video.google.com/)服务,该服务可以通过Google网站搜索最近播出的电视节目。目前该服务仍处于β测试阶段,且仅能搜索美国播出的电视节目。

其他工具
Google提供一个点击付费的广告服务叫做AdWords,它允许广告商们在Google搜索结果页和参与使用AdSense项目的网站上显示他们的广告条。
AdSense允许站长们显示Google广告在他们的站点上并以访问者点击获得收益。这项服务使用Google的相关文本技术以使广告内容与页面内容一致。
Google提供几种语言间实验性的机器翻译服务。
Google内置一个计算器和单位转换,见下。
2002年5月,Google在Google实验室里启动Google术语测试版。它可以对给定的词提供其不同网站上的定义。测试之后,Google现在将其与Google搜索合并;现在它称作Google Definitions。
2003年9月,Google启动地点搜索测试版,其类似与普通搜索,但它允许用户限制搜索美国境内的州,城市或邮政编码。它还提供用户相关地区的地图,估计距离,方位信息。这项服务最近重命名为Google Local。
2004年3月,Google实验室启动了两个测试。一个是个性化网页搜索,这是一个依赖于用户特征或兴趣的搜索引擎。另一个是Google网页提醒,这个工具会当网页上有用户定义的相关搜索新信息时会给用户发送提醒电子邮件。

Google工具软件

Google工具栏
Google工具栏是一个免费的IE插件。功能包括:在不打开Google网页的情况下随时搜索并查看相关页面信息;查看Google对网页的PageRank;阻止自动弹出窗口;自动填写表单;用不同颜色标识关键字。

有人指称使用它会带来安全风险,因为它会在无用户干预的情况下自动更新。

英语版的Google工具栏可以参与Google Compute计划,这是一个由美国斯坦福大学进行的帮助研究蛋白质折叠,误解,聚合及由此引起的相关疾病的分布式计算工程。(参见繁体中文说明 (http://www.equn.com/folding/big5.htm)简体中文说明 (http://www.equn.com/folding/)Google计算 (http://toolbar.google.com/dc/offerdc.html))

其他浏览器,如Mozilla Firefox,Opera和Safari,有提供相同功能的内建搜寻工具。Mozilla Firefox还有一个专门的Google工具栏:Googlebar,它是被独立开发的,并不被Google或Mozilla Firefox开发者所支持。它在官方的Google工具栏上做了扩展,惟一没被取代的功能是Google PageRank™。Google功能也已经被苹果电脑的新操作系统OS X的Safari所内建。

Google Deskbar
2003年12月,Google启动了测试版的Google Deskbar,这是一个运行在Microsoft Windows系统任务栏上的搜索工具,而不必打开网页浏览器。它还可以搜索电评论,股票价格,在在线字典和辞典中查找某字词的释义,查找任何预定义的第三方网站(例如eBay或亚马逊网上书店)。Deskbar被很多人认为最强大的功能之一就是所谓的全局指令键(Ctrl+Alt+G),无论在任何文档中选择关键字后都可以直接进行搜索。

对Google的批评
当Google显然已经开始被大众作为首选的搜索工具后,Google也同时成为被批评的对象.在线新闻站点们不喜欢Google新闻的发行.2003年2月,Google封了Oceana这个有着两年半历史的非盈利组织的广告,他们抗议了一个主巡航线的排污方法.在华盛顿电子隐私信息中心的副执长Chris Hoofnagle警告说"因为法院正在变得更为经常的用电子记录作为证据,Google的风险正在变大...这是一个严重的隐私威胁."

指责其产生的结果偏见的主张
2004年4月,Google接到了关于在其网站上搜索"Jew"(犹太人)时产生的结果的抱怨,反犹主义网站Jew Watch排在结果的首位.Google坚持他们的结果是由内容中立的算法计算的,Jew Watch网站 (http://www.google.com/explanation.html)这个网站因为被人在英文维基百科上放置了一个Google炸弹:Jew而排在结果首位的.Jew Watch在其他的搜索引擎上同样排名前列,如Yahoo!和MSN,但这些公司很少收到指责.

Jew Watch的主页四月末开始从Google搜寻结果中排名下降.因为期间Jew Watch的网络空间服务提供商EV1取消了它的帐号,这个网站因此有几天完全无法访问.因为Google的蜘蛛程序在重复尝试后无法到达该网站,于是它的排名在Google索引里开始滑落. [2] (http://news.com.com/2100-1038_3-5200203.html)这个站点之后找到了另一家服务提供商于是其在Google中的排名在五月的第一个星期开始上升.Google在2004年4月23日在其"讨厌的搜索结果里"解释说"被我们删除的网站都是法律上强迫我们删除的".


指责其进行自我审查的主张
宣扬种族优势和历史修正主义的网站已经在法国和德国Google上封锁很多年了,因为那些言论在当地不合法.其它潜在的争议性网站如赤裸裸的色情图片网站大部分没有收到影响,无论如何(缺省支持的"SafeSearch"滤镜)网络过滤程序在Google图像搜索上的作用并不是很明显.


指责其滥用隐私的主张
有人指责Google利用惟一标识cookies破坏了访问者的隐私.这些cookies不会过期并且用户的搜索请求在未得到同意的情况下被用于广告目的.Google宣称cookies是用来获取用户在不同session和网站的参数选择的,用户可以自己选择关闭cookies.

一些人相信Google的GMail会过度的处理信件内容.支持这观点的人一般没有GMail帐号,因为他们不同意GMail的服务条款,但问题是向GMail发信的用户也会收到未经批准的信件内容分析.Google宣称使用GMail发送或接受的信件不会被人类分析,它只用来改进广告内容关联性服务.

对PageRank系统的批评
Google的PageRank系统已经受到批评,一些人宣称其'不合理'. 普通的Google批评者称这套系统更偏向于大型网站,并且页面重要性的的标准并没用经过同业审查.

[蚌埠站长站转自维基百科]

 
 
 
 

© 版权所有 蚌埠站长站 2005 保留所有权利 不得随意复制传播
本站中出现的所有注册商标,均为商标持有人所有
All trademarks and copyrights held by respective owners. (c) BBZZ.net 2005 all rights reserved