• 怎样利用互联网学习与研究

全世界的人们在互联网上就无数论题提供了海量信息。在互联网上,用户可以访问到大量信息:大量的信息资源,电子邮件,文件传输,兴趣小组成员,交互式协作,多媒体展示等等。互联网上包含多种连接协议。这些协议包括e-mail, FTP, HTTP, Telnet和 Usenet新闻。 多数协议都有配套的支持程序,可让用户搜索和存取信息资源。

互联网并不是一个其中所有的资源已经分门别类,且可以从目录中检索的图书馆。 事实上,没有人了解互联网上有多少个文件。这个数字至少有数十亿,且正在快速增长。

互联网是一个自我发布的媒体。这意味着任何人只要有一些技能,就可以在互联网上的一台主机上发布信息。在你进行研究,寻找站点的时候,重要的是要记住这点。互联网站点的内容可根据创建者的喜好和承诺,随着时间可能会有改变。有些站点介绍专家领域的知识,而有些站点则是业余爱好者的天堂。有些站点也许会每天更新,而有些站点则是老面孔。对于这些资源,要评估所找到的信息的重要性。

注意互联网的地址经常会有变化,有的网站会消失掉。不要指望互联网是稳固不变的。

在互联网上开展研究的一个最为有效的方法就是使用全球网(WWW)。因为该网络包含了最重要的互联网协议,全球网提供了互联网上的大部分信息。

在互联网上如何寻找信息

要在互联网上获得信息有不少基本方法:

1 如果有网址,直接访问该网站

2浏览

3探索一个主题目录

4使用网络搜索引擎进行搜索

5在Web上的数据库中检索信息,即所谓的“深度Web”

6 加入 e-mail讨论组或者 Usenet新闻组

下面将详细介绍上面的每一个方法。

1. 如果有网址,就直接访问该网站

如果你知道要访问的网站的网址,可以使用 Web浏览器来访问该站点。需要的是在地址窗口输入该URL。URL代表统一资源定位符( Uniform Resource Locator)。 URL指明了对应的电子文档的互联网地址。互联网上的每个文件,无论其访问协议是什么,都有一个独一无二的URL。 Web浏览器使用 URL来存取主机目录中的文件。该文件随之显示在用户计算机的屏幕上。

URL的格式为 protocol://host/path/filename

可以在Web浏览器的地址窗口进行输入上面这些地址。

2. 浏览

浏览Web主页可以找到有用的信息,这个方法虽然有趣但不常见。 因为链接是由主页的创建者设定的,你不会预先知道这些链接连接到哪里。质量高的起始页面通常包含高质量的链接。大学图书馆的网站就包含了链接到Web中的好的链接,这是你开始探索的好地方。

3.探索主题目录

越来越多的大学,图书馆,公司,机构,甚至志愿者正在创建主题目录,以便对互联网上部分信息进行分类。这些目录按着主题分类,包含着同这些主题相关的互联网资源的链接。Web上的主题目录存储在有重复但各不相同的数据库中。大多数主题目录提供搜索功能,可以让用户根据需要查询数据库。

何时使用主题目录?对于一般的,需要探索的论题,以及供用户浏览的论题,主题目录是有用的。

有两种基本类型的主题目录:学术和专业目录通常由行业专家创建和维护,以便为研究服务,而商业门户网站中包含的目录通常是为了满足普通大众的需要,且为了吸引用户的访问量。你需要判断有关主题目录是否适合你的需要。

位于美国加州大学的INFOMINE,就是一个学术性的主题目录的范例。

Yahoo就是一个最著名的商业门户的例子

不同的主题目录在内容选择方面,差别很大。例如著名的Yahoo在添加网页到其数据库中时,对于用户提交的内容并不作仔细审核。因此它不是一个可靠的研究资源,且不应该用作研究。而INFOMINE仅选择对于学术和研究团体有用的资源。需要考虑到你所访问的目录的搜集策略。对于这个问题的一个挑战是:不是所有的目录服务供应者都愿意披露其搜集策略,同样他们也不愿意透露对其网站进行评论的人的身份和资质。不少主题目录包含描述或者评估网站内容的注解的链接。来自知名评论人士的质量好的注解比诸如Yahoo! 这样的由网站创建者写的注解更有价值。

某些目录是多年来的人们的智力劳动成果的结晶,了解这一点是有用的。所以,当在Web上开展研究时,查询主题目录是很重要的。

建议:

如果你打算查找大量的资源,可以试一试 图书馆的互联网索引 。由美国联邦政府支持的该索引,搜集了大量的加州图书馆的资源,以及对大量论题的网络资源的注解。 经过精心的和细致的搜集整理,加上其客观的富有价值的注解,以及层次化的组织,使得该索引成为“知识界的 Yahoo”。

WWW虚拟图书馆是网络上最久远的,也是最令人动心的主题了。其目录包含了单个的主题的集合,其中不少主题是由位于全球的大学来维护的。

INFOMINE 是一个由加州大学维护的大型学术网站目录,该目录可以通过主题,关键字,或者标题来浏览。对于每个列出的网站都有描述。
 

4. 使用Web搜索引擎,开展研究

一个互联网搜索引擎可以让用户输入同论题相关的关键字,查到包含相关信息的网站。有多种支持各种互联网协议的搜索引擎。例如,Archie用于搜索存储在匿名FTP网站中的文件。

目前,Web本身已经成为互联网环境的首选,位于Web中的搜索引擎越来越受到欢迎。Web搜索引擎能够提供位于互联网中的大量网站的信息。不少搜索引擎汇集了多种互联网协议的数据库,包括HTTP, FTP和Usenet。它们也能够在Web中深入搜索到多媒体或者其他类型的文件,且可进行单项搜索。虽然Web搜索引擎主要由私营公司开发,但其中的大多数是免费的。

一个Web搜索引擎包含三个部分:

爬虫:能够从一个链接到另外一个链接,遍历网络,且识别和阅读网页的程序。

索引:包含由爬虫搜集的网页的副本的数据库

搜索引擎机制: 可以让用户查询索引的软件,通常根据相关度返回结果。

注意爬虫程序是不加选择地进行遍历的,要知道一些搜集到的资源可能是过时的,不准确或者不完整的。剔除这些不准确的资源,其他的查到的资源当然是有根有据的和有价值的。需要仔细评估所有的搜索结果。

大多数搜索引擎使用时,是在搜索项中填写表格,之后请求搜索。该搜索引擎查询其索引,之后生成一个包含你的搜索项的部分或者全部内容的链接资源的页面。这些资源列表的排列通常是有次序的,对于搜索内容的打分比较曾经是个流行的方法,如果你的搜索项在一个文档中(包括在文档的标题中,在文档的开始,在文档的结束位置等)出现的次数越多,那么该文档在就在搜索结果列表中就越处于开始的地位。 这类引擎被认为是第一代搜索引擎。

在搜索引擎技术中更为复杂的一项技术是根据概念,关键字,网址,链接或者流行度来对搜索结果排序。支持这些功能的搜索引擎被认为是第二代搜索引擎。这些搜索引擎对排序结果进行了改进。这是因为在决定相关度的时候,需要加上人为因素。例如,Google根据链接到其他页面的网页的排序得分对搜索结果进行排序。 如果有其他得分高的页面链接到该页面,那么该页面的得分就高。这个策略结合了技术和人为的判断。

所有的搜索引擎都有查寻规则。在开始搜索之前,你需要阅读帮助文件,在线教程也可以帮助你学会这些规则。本文的最后列出了一些推荐教程。

建议:

从Google开始。这是个著名的第二代搜索引擎,其页面的排序是基于热门网页链接到的数量来决定的。包含这些链接的网页越热门,该页面的排列位置越靠前。这些热门网页的排列位置同样也是这样确定的。 这里用到的思想是:高质量的网页可以通过另外一个高质量的网页的链接找到。Google在市场上大获成功,这就是该排序理念的见证。

另外一个有趣的链接排序引擎是Teoma。该搜索工具把搜索结果组成为三个部分:按照得分高低排序的网页列表,专家给出的相关网站的链接, 以及基于论题关键字的概念分类。这些分类是动态生成的,可以细化你的搜索结果。排序同Google有些不同,Teoma在搜索论题时,在同一类别中来对网页排序。 它们被称为“特定主题的流行度”。

如果你的论题不太明确,或者你打算一次用一个搜索语句获得多个搜索引擎的结果,那么Ixquick 是个好去处。该服务同时使用多个搜索工具,并返回剔除了重复页面的搜索结果。这种搜索处理称为元搜索。值得一提的是:Ixquick在源搜索服务中,仅仅返回最靠前的10个相关结果。这就意味着你一次可以使用多个搜索引擎来查询。其他推荐的元搜索引擎包括 Vivisimo和ProFusion。

 5. 探索“深度Web”

“深度”或者“不可见”Web的概念近来开始浮现,这是指存储在Web数据库中的,但搜索引擎访问不到的内容。换句话说,对于搜索引擎来说是“不可见”的。不同于检索静态页面,爬虫程序无法进入到数据库中检索内容,以往,这些数据库数量少,被称为专门数据库,主题数据库等。

在不可见Web中访问信息的最好方法是搜索这些数据库,这些数据库包罗万象,从学术资源到商业信息。近来,动态生成的信息很可能是存储在数据库中,包括新闻,求职信息,飞机航班信息等等。随着通过Web访问的数据库数量的增加,通过数据库来在Web上寻找信息将成为主流。

其他未被爬虫搜集的内容包括非文本文件,诸如多媒体文件,图像文件,以及象PDF这样的非标准格式文件。Google对此是个例外,它可以检索到PDF, Word和其他文档。

注意:不少搜索引擎网站以及商业门户网站把能够搜索深度Web作为其服务项目之一,这种内容汇集是大势所趋。例如,你可以访问AltaVista,查找新闻,地图,职位信息,拍卖,购物信息等等,所有这些都处于爬虫程序搜索的范围之外,另外一个例子,Google把 PDF和Microsoft Office文件的检索功能集成到其通用搜索服务中。

我们是专业的广州网站设计网站建设公司,在各行业网站建设网站制作网页设计网站开发应用上有着成熟、丰富的项目经验,网站建设咨询电话:020-38847510 ,欢迎来访或来电垂询,我们随时乐意为您服务!
上一篇品牌通运营总监冯志亮谈及谷歌改进问题  下一篇网上签合同 可要小心点
【 字体: 收藏】  打印关闭】标签:网站制作 研究 海柳网络公司
【作者:网络公司】【来源:网络转载】 录入:【广州网站设计】 编辑:广州网站建设公司
  • 相关链接