Django实现全文检索的方法(支持中文)

这篇文章主要介绍了Django实现全文检索的方法(支持中文),小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

PS: 我的检索是在文章模块下 forum/article

第一步:先安装需要的包:

 pip install django-haystack pip install whoosh pip install jieba

第二步: 配置需要的文件 settings.py

添加haystack应用模块

 INSTALLED_APPS = ( ... 'haystack', ... ) 

在settings.py 末尾添加

 HAYSTACK_CONNECTIONS = { 'default': { 'ENGINE': 'article.whoosh_cn_backend.WhooshEngine', 'PATH': os.path.join(BASE_DIR, 'whoosh_index'), }, } HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'  # 索引自动更新

第三步: 配置url路径

在 forum/forum/urls.py中包含search路径

 url(r'^search/', include('haystack.urls')), 

第四步:建立模型

forum/article/models.py

 class Article(models.Model): ''' 文章数据模型 ''' id = models.AutoField(primary_key=True,verbose_name='文章编号') title = models.CharField(max_length=50,verbose_name='文章标题') content = MDTextField() publish_time = models.DateTimeField(auto_now_add=True,verbose_name='发表时间') last_update_time = models.DateTimeField(auto_now=True,verbose_name='最后一次修改时间') status = models.IntegerField(u'状态', default=1) read_count = models.IntegerField(default=0,verbose_name='阅读次数') comment_count = models.IntegerField(default=0,verbose_name='评论次数') #关联用户 user = models.ForeignKey(User,on_delete=models.CASCADE,verbose_name='用户') subject = models.ForeignKey(Subject, null=True, blank=True, on_delete=models.CASCADE, verbose_name='属于哪一个专题') 

第五步:设置为那个class建立索引

如果你想针对某个app例如mainapp做全文检索,则必须在mainapp的目录下面建立search_indexes.py文件,文件名不能修改
例:forum/article/search_indexes.py模块

 from article.models import Article from haystack import indexes class ArticleIndex(indexes.SearchIndex, indexes.Indexable): text = indexes.CharField(document=True, use_template=True) def get_model(self): return Article def index_queryset(self, using=None): return self.get_model().objects.filter(status=1) 

每个索引里面必须有且只能有一个字段为document=True

第六步: 确定我们需要的属性:

新建yourapp/templates/search/indexes/yourapp/article_text.txt来指明需要属性

例: article/templates/search/indexes/yourapp/article_text.txt

 {{ object.title }} # 文章标题 {{ object.user.username }} # 文章作者 {{ object.content }} # 文章内容

第七步: 把搜索引擎放入项目下

例: forum/article/whoosh_cn_backend.py

将文件whoosh_backend.py(例: 我的python路径E:\python\Lib\site-packages\haystack\backends\whoosh_backend.py
)放到article下,并重命名为whoosh_cn_backend.py,例如blog/whoosh_cn_backend.py。修改如下:

导入 

 from jieba.analyse import ChineseAnalyzer

找到

复制代码 代码如下:
schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer(), field_boost=field_class.boost, sortable=True)

然后将其修改为

复制代码 代码如下:
schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=ChineseAnalyzer(), field_boost=field_class.boost, sortable=True)

成功引入jieba分词

第八步: 前端页面配置

templates/base.html (搜索页面)

 

结果展示页面(forum/article/templates/search/search.html)

 {% extends 'base.html' %} {% block title %}搜索结果{% endblock %} {% block content %} 
 
{% if query %}

搜索结果

{% for result in page.object_list %} {% empty %}

没有得到想要的结果哦.

{% endfor %}

{{ result.object.title }}

作者: {{ result.object.user.username }}

{{ result.object.content | safe | truncatechars_html:40 }}

{% if page.has_previous or page.has_next %}
{% if page.has_previous %}{% endif %}« 上一页{% if page.has_previous %}{% endif %} | {% if page.has_next %}{% endif %}下一页 »{% if page.has_next %}{% endif %}
{% endif %} {% else %} {# Show some example queries to run, maybe query syntax, something else? #} {% endif %}
{% endblock %}

第九步: 建立索引

 python manage.py rebuild_index

建立成功会自行生成一个forum/whoosh_index的文件夹

第十步: 运行程序

 python manage.py runserver

PS: 模板样式可以自行调整

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持html中文网。

以上就是Django实现全文检索的方法(支持中文)的详细内容,更多请关注0133技术站其它相关文章!

赞(0) 打赏
未经允许不得转载:0133技术站首页 » python