当前位置:首页 > linux教程 > 列表

linux下coreseek 安装及使用方法详解

发布:smiling 来源: PHP粉丝网  添加日期:2015-05-06 10:58:35 浏览: 评论:0 

很多使用php+mysql数据库的朋友都有可能使用到coreseek了,coreseek是一款非常不错的中文全文检索/搜索软件了,下面小编就一起来看看吧.

一般站点都需要搜索功能,如果是php+mysql站点,建议选择coreseek,如果是java站点建议使用lucene,coreseek 是一款很好的中文全文检索/搜索软件,支持高速建立索引、有很强的扩展性、支持分布式检索,支持不同的搜索模式(’完全匹配’,’短语匹配’,’任一匹配’).

一、coreseek 安装

1:安装mmseg分词库

  1. wget http://www.coreseek.cn/uploads/csft/4.0/coreseek-3.2.14-beta.tar.gz 
  2. tar -zxvf coreseek-3.2.14-beta.tar.gz 
  3. cd coreseek-3.2.14-beta 
  4. cd mmseg-3.2.14 
  5. ./bootstrap     
  6. ./configure --prefix=/usr/local/mmseg3 #配置安装目录 
  7. make  
  8. make install 
  9. cd .. 

2:安装coreseek

  1. cd csft-3.2.14 
  2. sh buildconf.sh  
  3. ./configure --prefix=/usr/local/coreseek  --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql=/usr/local/mysql 
  4. make  
  5. make install 
  6. cd.. 

3:测试mmseg分词和coreseek检索

  1. cd /usr/local/src/coreseek-3.2.14 
  2. cd testpack 
  3. cat var/test/test.xml    #现实的是中文的内容 
  4. /usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc var/test/test.xml #显示xml文件内容 
  5. /usr/local/coreseek/bin/indexer -c etc/csft.conf --all #建立索引 
  6. /usr/local/coreseek/bin/search -c etc/csft.conf # 进行搜索 

二、coreseek配置和使用

1:配置example.conf文件

  1. cd /usr/local/coreseek/etc 
  2. cp sphinx-min.conf.dist example.conf 

对example.conf的配置进行改造,变成我们所需的配置文件.

  1. source example 
  2.     type                    = mysql 
  3.     sql_host                = localhost 
  4.     sql_user                = *** 
  5.     sql_pass                = *** 
  6.     sql_db                    = *** 
  7.     sql_port                = 3306 
  8.     sql_sock            = /tmp/mysql.sock     
  9.     sql_query_pre            = SET NAMES utf8 
  10.     sql_query                = SELECT id,content FROM table_name #不管表的主键叫什么,查出来的结果都是为id 
  11.    sql_query_info_pre      = SET NAMES utf8                      #命令行查询时,设置正确的字符集 
  12.    sql_query_info          = SELECT * FROM table WHERE id=$id  LIMIT 100#命令行查询时,从数据库读取原始数据信息 
  13. #index定义 
  14. index example 
  15.     source            = example             #对应的source名称 
  16.    path            = /usr/local/coreseek/var/data/example/ #请修改为实际使用的绝对路径 
  17.    docinfo            = extern 
  18.     mlock            = 0 
  19.     morphology        = none 
  20.     min_word_len        = 1 
  21.     html_strip                = 0 
  22.     #中文分词配置,详情请查看:http://www.coreseek.cn/products-install/coreseek_mmseg/ 
  23.    charset_dictpath = /usr/local/mmseg3/etc/ #BSD、Linux环境下设置,/符号结尾 
  24.    #charset_dictpath = etc/  #Windows环境下设置,/符号结尾,最好给出绝对路径, 
  25.    charset_type        = zh_cn.utf-8 
  26. }  //phpfensi.com 
  27.  
  28. #全局index定义 
  29. indexer 
  30.     mem_limit            = 128M 
  31. #searchd服务定义 
  32. searchd 
  33.     listen                  =   9312 
  34.     read_timeout        = 5 
  35.     max_children        = 60 
  36.     max_matches            = 1000 
  37.     seamless_rotate        = 0 
  38.     preopen_indexes        = 0 
  39.     unlink_old            = 1 
  40.     pid_file = /usr/local/coreseek/var/log/searchd_example.pid  #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/... 
  41.    log = /usr/local/coreseek/var/log/searchd_example.log  #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/... 
  42.    query_log = /usr/local/coreseek/var/log/query_example.log #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/... 

2:开启searchd服务(这点很重要).

coreseek刚安装后searchd服务是没开启的,需要先开启,不然创建索引的时候会出错,先在 /usr/local/src/coreseek/var/log下创建一个searchd_example.pid文件,然后执行下面的代码:

  1. /usr/local/coreseek/bin/searchd --config /usr/local/coreseek/etc/example.conf 

3:创建索引

/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/example.conf --all --rotate

出现下面的提示:

  1. Coreseek Fulltext 3.2 [ Sphinx 0.9.9-release (r2117)] 
  2. Copyright (c) 2007-2011, 
  3. Beijing Choice Software Technologies Inc (http://www.coreseek.com) 
  4.  using config file '/usr/local/coreseek/etc/example.conf'... 
  5. indexing index 'example'... 
  6. collected 1 docs, 0.0 MB 
  7. sorted 0.0 Mhits, 100.0% done 
  8. total 1 docs, 631 bytes 
  9. total 0.005 sec, 118854 bytes/sec, 188.35 docs/sec 
  10. total 1 reads, 0.000 sec, 0.8 kb/call avg, 0.0 msec/call avg 
  11. total 5 writes, 0.000 sec, 0.5 kb/call avg, 0.0 msec/call avg 
  12. rotating indices: succesfully sent SIGHUP to searchd (pid=14094). 

说明coreseek已经可以使用了.

可以把创建索引的命令写入crontab里面进行定时,实时更新索引.

4:php 和 coreseek 结合进行查询

先下载sphinxapi,然后文件引入结合php进行查询,下面更多参数的详解和配置,可以参考 coreseek api php手册.

  1. require_once('sphinxapi'); 
  2. $s = new SphinxClient(); 
  3. $s->SetServer('127.0.0.1','9312'); //设置searchd的主机名和TCP端口 
  4. $s->SetConnectTimeout(1); // 设置连接超时 
  5. $s->SetMatchMode(SPH_MATCH_BOOLEAN); //设置全文查询的匹配模式 
  6. $page_size=20;//自己定义的页数 
  7. $s->SetLimits($start,$page_size); //设置返回结果集偏移量和数目 
  8. $s->SetSortMode( SPH_SORT_EXTENDED,"good_count DESC, @id DESC" ); // 设置排序 
  9. $s->SetArrayResult(true);//控制搜索结果集的返回格式 
  10. $res = $s->Query($keyword,'*');// 执行搜索查询 
  11. $res_list = $res['matches']; 

coreseek安装遇到的错误和问题解决方案.

1、测试mmseg分词的时候

执行:/usr/local/coreseek/bin/indexer -c etc/csft.conf --all

提示下面的错误:

  1. /usr/local/coreseek/bin/indexer: error while loading shared libraries: libmysqlclient.so.18: cannot open shared object file: No such file or directory 

原因:sphinx indexer的依赖库ibmysqlclient.so.18找不到.

解决办法:

vi /etc/ld.so.conf

加入 /usr/local/mysql/lib

然后运行 ldconfig 问题解决

2、执行索引的时候

  1. /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_ttd_search.conf --all --rotate 

提示下面的错误:

  1. FATAL: failed to open /usr/local/coreseek/var/data/ttd_article/.tmp.spl: No such file or directory, will not index. Try --rotate option. 

原因:source源找不到mysql.sock

解决办法:在配置文件csft_ttd_search.conf(自己创建的文件)的 source源 加入下面的代码.

sql_sock   = /tmp/mysql.sock

3、执行索引的时候,出现的警告,导致索引没创建成功.

  1. WARNING: failed to open pid_file '/usr/local/coreseek/var/log/searchd_ttd_search.pid'. 
  2. WARNING: indices NOT rotated. 

原因:找不到searchd_ttd_search.pid文件

解决办法:在’/usr/local/coreseek/var/log 下创建searchd_ttd_search.pid文件

再执行/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_ttd_search.conf –all –rotate

出现了另外一个警告:

  1. WARNING: failed to scanf pid from pid_file '/usr/local/coreseek/var/log/searchd_ttd_search.pid'. 
  2. WARNING: indices NOT rotated. 

原因:虽然创建了searchd_ttd_search.pid文件,但是里面没有写入进程id

解决办法(根本原因):在执行索引之前没有启动searchd服务,因此执行下面的命令.

  1. /usr/local/coreseek/bin/searchd --config /usr/local/coreseek/etc/ttd_search.conf 

出现了期待已久的成功提示:

  1. Coreseek Fulltext 3.2 [ Sphinx 0.9.9-release (r2117)] 
  2. Copyright (c) 2007-2011, 
  3. Beijing Choice Software Technologies Inc (http://www.coreseek.com) 
  4. using config file '/usr/local/coreseek/etc/ttd_search.conf'... 
  5. listening on all interfaces, port=9312 
  6. rotating index 'mysql': success

Tags: coreseek linux安装使用

分享到: