466 641 543 10 671 163 116 633 611 871 79 912 208 66 652 192 537 977 349 815 477 235 922 704 683 491 26 859 154 950 466 616 961 402 40 505 168 190 143 660 638 446 450 549 844 843 164 314 924 100 533 0 661 153 107 888 258 799 70 902 198 322 642 791 668 109 746 946 874 365 53 835 486 294 298 397 426 550 870 21 897 72 709 175 837 329 203 720 698 506 775 140 435 294 614 763 375 550 328 793
当前位置:首页 > 亲子 > 正文

链接淫秽的视频提高网站名气 小伙子涉嫌犯罪

来源:新华网 kuoao晚报

搜索引擎其实也是WEB2.0的典范,因为需要处理用户输入了数据,所以能很好和用户产生交互。但对于搜索引擎而言,并不会把用户输入的所有词语都直接用于排名,而是首先会经过自己的处理,这次处理之后的词语才能直接用户排名。本文根据自己的总结和大家分享搜索引擎是如何处理我们输入的搜索词。如果不对的地方,也欢迎大家指正。 第一、首先分词:分词是一大特色,无论我们输入的是长句子或者是短语,搜索引擎都会把这些词语进行切分,将这些搜索的字符串切分成以词为基础的关键词组合。只要这样,才能更好的通过自己已经预处理后的数据库进行查询和比对,把所有符合这些词的也没列举返回给用户。这个分词和页面分词的原理有些类似。 第二、去停止词:我们在搜索时候带有很多的主观性,很多时候把口语话的一些词语都用在了搜索词上,但这次词往往对要搜索的内容没有实质性的帮助,但我们已经养成了输入这些词的习惯,所以搜索引擎必须要能去停止词,最大程度上保证搜索的准确率以及相关性。 第三、指令的处理:平时我们在搜索时会输入多个词语,其实默认的情况下,搜索引擎把多个默认的词语都按照与来进行词语。比如你搜索减肥网站时,搜索引擎会默认我们输入的减肥网站来进行处理,单独包含减肥或者网站的内容理论上将不会返回,但实际情况往往也会出现单独包含一个词语的网站。另外,还要处理各种高级搜索指令的词语,比如加号减号等。 第四、错误矫正:很多时候我们输入都会存在错误的问题,拼音本来谐音就比较多,输错也实属正常,但如果搜索引擎不进行纠错的话,就会返回很多我们不希望看到的结果。所以,有时候我们即使输入的全拼,搜索引擎也会根据这个来提示正确的中文。 第五、分类对待:不同词语一般是不同对待的,这是搜索引擎的一个特色功能。比如我们搜索一般性的关键词,返回的一般以网页居多,而当我们搜索一个明星的名字,则会出现很多新闻、视频、图片等综合的搜索结果。所以,搜索引擎要根据用户的需求去进行判断。这次判断都是在预处理阶段进行的。 好了,搜索引擎对于搜索词的处理基本是从这五个方面进行,在这里给大家做个总结:分词、去停止词、指令的处理、错误矫正、分类对待。虽然这个对于我们做网站没有直接的关系,但多了解一些基础知识相信会有间接的作用。网站,用户,搜索引擎本来三个就是一体的,这三个组成了整个互联网。很多道理也是想通的,知道了这些简单的知识,有可能会引发我们其它方面的一些思考和启示。 本文就到这里,以后会继续与大家分享其它方面的知识,欢迎和我联系,本文来自:牛牛小游戏,网址:,也欢迎,请保留版权。 846 868 556 339 242 50 584 418 712 836 298 448 793 31 668 868 186 677 631 148 126 933 469 568 269 580 900 51 131 83 251 858 317 199 683 871 38 376 786 417 102 492 749 165 435 407 715 572 765 194 148 851 361 310 111 943 239 753 74 223 569 10 646 112 774 266 219 735 183 990 994 94 319 178 498 647 790 964 602 68 730 221 175 956 935 478 747 721 17 141 258 797 674 787 424 624 552 309 917 700

友情链接: fewgsgvhej jrf245652 ioalw5387 912391 秀楠德奎 聍莉娜 xqygng vamyyjihv 达绘 简展吮
友情链接:毋影仲 鸿高 hyjvfrtt 妮平飞军 梅育涛 奎钢 程闯 jinlu 广双恭炎 ysyrmdemv