sphinx的实时索引

2013-01-24
sphinx目前出来一个realtime index即实时索引
据官方透露,目前已经开始可以在生产环境使用
他可以使用sphinxQL用mysql协议进行查询添加更新数据
看起来像一个mysql一样,不过他支持全文检索,新更新进去的数据会自动索引达到实时索引的程度
但是他也有缺点,比如经常更新会导致内存增长
在内存中的数据如果不及时写入硬盘,出现中断会丢失数据
只支持部分sql语句,前段时间简单测试了一下
如果数据量巨大他会变得缓慢,在内存数据往硬盘写的时候会卡几秒
下面是sphinx.conf内的一段关于实时索引的语句
index rt
{
# 实时索引类型
type = rt</p>

# 索引保存路径,平时都是保存在内存内,数据量超过内存量的时候会保存在文件内,这里随便存了下没放到data目录下
path = /usr/local/sphinx/var/data/rttest

# 内存保存大小限制,超过这个就会保存到硬盘中
# optional, default is 32M,默认32m
#
rt_mem_limit = 32M

# 全文检索字段声明,这里把实时索引的索引字段都声明出来
rt_field = title #全文索引字段
#rt_field = content
rt_attr_uint = gid #其他属性字段,可以用来查询
rt_attr_bigint = guid
#rt_attr_float = gpa
#rt_attr_timestamp = ts_added
#rt_attr_string = author
}
searchd
{
#这里配置很多只说关键的地方
listen = 9306:mysql41 #searchd支持mysql协议连接的端口
max_matches = 3000 #在mysql协议内查询出来的数据只会返回3000条,即使使用limit语句也是如此
}

启动searchd后
shell下命令
mysql -P 9306 -h 127.0.0.1
连接sphinx

添加数据
insert into rt values(3,’test’,1,2);
注意,第一个字段必须指定值,因为id是sphinx内指定的唯一id

我用脚本添加了一批随机数据

下面可以用sql查询
select * from rt order by id desc limit 1;

+———+——–+——+——-+
|id | weight | gid | guid |
+———+——–+——+——-+
| 2613327| 1 | 179 | 45759 |
+———+——–+——+——-+
1 row in set (0.57 sec)
如果不执行全文检索,那么性能和没有建立索引的mysql效果是一样
其中weight是结果匹配权重

使用matchs在where内可以做全文检索
大家可以参考官方文档,注意哦目前只有2.0.6才开始声明realtime index可以用于生产环境了
2.0.6官方文档网址:
http://sphinxsearch.com/docs/2.0.6/