摘要:
Google的首页很清爽,LOGO下面,排列了四大功能模块:网站、图像、新闻组和目录服务。在搜索框内输入一个关键字" 搜索引擎" , 选中" 搜索中文(简体)网页" 选项,然后点击下面的" Google搜索" 按钮(或者直接回车),结果就出来了。关键字:
Google 正文:
英文单词,如" i" 、" com" 、" www" 等,以及一些符号如" *" 、" ." 等,作忽略处理。
示例:搜索关于www起源的一些历史资料。
搜索:" www的历史 internet"
我们看到,搜索" www的历史 internet" ,但搜索引擎把" www" 和" 的" 都省略了。于是上述搜索只搜索了" 历史" 和" internet" 。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索" www的历史" 的时候,搜索引擎实际上把这个短语分成三部分," www" 、" 的" 和" 历史" 分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的" www的历史" ,但搜索引擎还是把这个短语当成三个关键字分别检索。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的" +" 号。
搜索:" +www +的历史 internet"
结果:已搜索有关+www +的历史 internet的中文(简体)网页。 共约有25,000项查询结果,这是第1-10项 。 搜索用时0.05秒。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例" " world war I" " 中," I" 其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。
搜索:" www的历史" internet"
结果:已搜索有关" www的历史" internet的中文(简体)网页。 共约有7项查询结果,这是第1-6项 。 搜索用时0.26秒。
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
进阶搜索
8:对搜索的网站进行限制
" site" 表示搜索结果局限于某个具体网站或者网站频道,如" www.sina.com.cn" 、" edu.sina.com.cn" ,或者是某个域名,如" com.cn" 、" com" 等等。如果是要排除某网站或者域名范围内的页面,只需用" -网站/域名" 。
示例:上著名IT门户网站ZDNET和CNET搜索一下关于搜索引擎技巧方面的资讯。
搜索:" " search engine" tips site:www.zdnet.com OR site:www.cnet.com"
结果:已在www.zdnet.com内搜索有关" search engine" tips OR site:www.cnet.com的网页。 共约有1,040项查询结果,这是第1-10项 。 搜索用时0.09秒。
注意,在这里Google有个小BUG。" 已在www.zdnet.com内搜索..." ,其实应该表述成" 已在www.zdnet.com和www.cnet.com内搜索..." 。
示例:搜索新浪科技频道中关于搜索引擎技巧的信息。
搜索:" 搜索引擎 技巧 site:tech.sina.com.cn"
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则," site:" 将被作为一个搜索的关键字。此外,网站域名不能有" http://" 前缀,也不能有任何" /" 的目录后缀;网站频道则只局限于" 频道名.域名" 方式,而不能是" 域名/频道名" 方式。
9:在某一类文件中查找信息
" filetype:" 是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索几个资产负债表的Office文档。
搜索:" 资产负债表 filetype:doc OR filetype:xls OR filetype:ppt"
注意,下载的Office文件可能含有宏病毒,谨慎操作。
示例:搜索一些关于搜索引擎知识和技巧方面的PDF文档
搜索:" " search engine" tips OR tutorial filetype:
[1][2][3]