Django实现全文检索的方法(支持中文)
作者:___大鱼___ 发布时间:2023-12-04 14:35:13
PS: 我的检索是在文章模块下 forum/article
第一步:先安装需要的包:
pip install django-haystack
pip install whoosh
pip install jieba
第二步: 配置需要的文件 settings.py
添加haystack应用模块
INSTALLED_APPS = (
...
'haystack',
...
)
在settings.py 末尾添加
HAYSTACK_CONNECTIONS = {
'default': {
'ENGINE': 'article.whoosh_cn_backend.WhooshEngine',
'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
},
}
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor' # 索引自动更新
第三步: 配置url路径
在 forum/forum/urls.py中包含search路径
url(r'^search/', include('haystack.urls')),
第四步:建立模型
forum/article/models.py
class Article(models.Model):
'''
文章数据模型
'''
id = models.AutoField(primary_key=True,verbose_name='文章编号')
title = models.CharField(max_length=50,verbose_name='文章标题')
content = MDTextField()
publish_time = models.DateTimeField(auto_now_add=True,verbose_name='发表时间')
last_update_time = models.DateTimeField(auto_now=True,verbose_name='最后一次修改时间')
status = models.IntegerField(u'状态', default=1)
read_count = models.IntegerField(default=0,verbose_name='阅读次数')
comment_count = models.IntegerField(default=0,verbose_name='评论次数')
#关联用户
user = models.ForeignKey(User,on_delete=models.CASCADE,verbose_name='用户')
subject = models.ForeignKey(Subject, null=True, blank=True, on_delete=models.CASCADE,
verbose_name='属于哪一个专题')
第五步:设置为那个class建立索引
如果你想针对某个app例如mainapp做全文检索,则必须在mainapp的目录下面建立search_indexes.py文件,文件名不能修改
例:forum/article/search_indexes.py模块
from article.models import Article
from haystack import indexes
class ArticleIndex(indexes.SearchIndex, indexes.Indexable):
text = indexes.CharField(document=True, use_template=True)
def get_model(self):
return Article
def index_queryset(self, using=None):
return self.get_model().objects.filter(status=1)
每个索引里面必须有且只能有一个字段为document=True
第六步: 确定我们需要的属性:
新建yourapp/templates/search/indexes/yourapp/article_text.txt来指明需要属性
例: article/templates/search/indexes/yourapp/article_text.txt
{{ object.title }} # 文章标题
{{ object.user.username }} # 文章作者
{{ object.content }} # 文章内容
第七步: 把搜索引擎放入项目下
例: forum/article/whoosh_cn_backend.py
将文件whoosh_backend.py(例: 我的python路径E:\python\Lib\site-packages\haystack\backends\whoosh_backend.py
)放到article下,并重命名为whoosh_cn_backend.py,例如blog/whoosh_cn_backend.py。修改如下:
导入
from jieba.analyse import ChineseAnalyzer
找到
schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer(), field_boost=field_class.boost, sortable=True)
然后将其修改为
schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=ChineseAnalyzer(), field_boost=field_class.boost, sortable=True)
成功引入jieba分词
第八步: 前端页面配置
templates/base.html (搜索页面)
<form class="navbar-form navbar-left" action="/search/" method="get">
<div class="form-group">
<input type="text" class="form-control" name="q" placeholder="请输入搜索的内容" value=""/>
</div>
<input type="submit" value="搜索">
</form>
结果展示页面(forum/article/templates/search/search.html)
{% extends 'base.html' %}
{% block title %}搜索结果{% endblock %}
{% block content %}
<div class="container" id="content">
<div class="search-body">
<form method="get" action="">
<table>
<tr>
<td>
<label for="id_q"></label>
</td>
<td>
<input class="form-control" id="id_q" name="q" type="search" value="{{ query }}" />
</td>
<td> </td>
<td>
<button class="btn btn-defaul" type="submit"><span class="glyphicon glyphicon-search">搜索</span></button>
</td>
</tr>
</table>
</form>
{% if query %}
<h3>搜索结果</h3>
<table class="table">
<tr>
{% for result in page.object_list %}
<td>
<p>
<a href="{% url 'article:article_detail' article_id=result.object.id %}" rel="external nofollow" >
{{ result.object.title }}</a>
</p> 作者: <a href="{% url 'user:user_index' result.object.user.id %}" rel="external nofollow" >{{ result.object.user.username }}</a>
<p>{{ result.object.content | safe | truncatechars_html:40 }}</p>
</td>
</tr>
{% empty %}
<p>没有得到想要的结果哦.</p>
{% endfor %}
</table>
{% if page.has_previous or page.has_next %}
<div>
{% if page.has_previous %}<a href="?q={{ query }}&page={{ page.previous_page_number }}" rel="external nofollow" >{% endif %}« 上一页{% if page.has_previous %}</a>{% endif %}
|
{% if page.has_next %}<a href="?q={{ query }}&page={{ page.next_page_number }}" rel="external nofollow" >{% endif %}下一页 »{% if page.has_next %}</a>{% endif %}
</div>
{% endif %}
{% else %}
{# Show some example queries to run, maybe query syntax, something else? #}
{% endif %}
</div>
</div>
{% endblock %}
第九步: 建立索引
python manage.py rebuild_index
建立成功会自行生成一个forum/whoosh_index的文件夹
第十步: 运行程序
python manage.py runserver
PS: 模板样式可以自行调整
来源:https://www.jianshu.com/p/4f88d5f09ce3
猜你喜欢
- 在所有信息技术领域,网页设计、网站设计长期是个几乎搞不清楚的、弱势的、被边缘化的职能职位。但近些年发展中,不断有远见卓识的从业者认识到,“设
- django 创建过滤器一、需求来源:假如有一个模板文件有一个字符串变量,这个字符串变量中不能有任何的空格,而恰恰这个模板被很多个视图函数多
- BULK COLLECT(成批聚合类型)和数组集合type类型is table of 表%rowtype index by binary_i
- 如果一张表的数据达到上百万条,用游标的方法来删除简直是个噩梦,因为它会执行相当长的一段时间…… 开发人员的噩梦——删
- 准备必须环境:Python3开始先实现一个简单的版本,直接上代码:import urllib.requestimport urllib.er
- 前言PDO扩展为PHP访问数据库定义了一个轻量级的、一致性的接口,它提供了一个数据访问抽象层,这样,无论使用什么数据库,都可以通过一致的函数
- python的验证码库(captcha)将验证码做成这样:是不是和各大网页的图片源地址是一样,话不多说,让我们看代码:我是用django和p
- 么是约瑟夫问题?约瑟夫问题是一个有趣的数学游戏,游戏规则如下:1、N个人围成一个圈,编号从1开始,依次到N。2、编号为M的游戏参与者开始报数
- 最近由于要毕业了写论文做毕设,然后还在实习发现已经好久都没有写博客了。今天由于工作需求,需要用Django实现单用户登录。大概意思就是跟QQ
- 出自: 编程中国 http://www.bc-cn.net作者: 天涯听雨 &nbs
- 具体编译过成与正常的Python源代码在x86平台上的过程无异,此篇随笔仅当用作复制黏贴的备忘录。不得不说在一个老旧系统上安装一个老旧的Py
- 在安装依然主机管理系统时,因为当时导入MSSQL时有点问题,所以,为了赶快能用上管理功能,所以就暂时先用了Access数据库。不过一直以来都
- 前言两者的比较只是编程实现上的差异,请不要绝对化、教条化。这里只从技术方面讨论。这种区别非常细,局限于特定场合。在Python编程语言中,遍
- 批量修改linux服务器密码,同时生成execl表格#!/usr/bin/env python#coding:utf8#随机生成自定义长度密
- 定义神经网络继承nn.Module类;初始化函数__init__:网络层设计;forward函数:模型运行逻辑。class NeuralNe
- Python判断变量是否已经定义是一个非常重要的功能,本文就来简述这一功能的实现方法。其实Python中有很多方法可以实现判断一个变量是否已
- 该算法实现对列表中大于某个阈值(比如level=5)的连续数据段的提取,具体效果如下:找出list里面大于5的连续数据段:list = [1
- 对于如何结束一个Python程序或者用Python操作去结束一个进程等,Python本身给出了好几种方法,而这些方式也存在着一些区别,对相关
- 关于Pytorch的MNIST数据集的预处理详解MNIST的准确率达到99.7%用于MNIST的卷积神经网络(CNN)的实现,具有各种技术,
- 首先我们有这么一种需求,就是我在一个列表中点击了某个item,跳转到详情界面,那么我就需要把item的实体数据从列表页面传递到详情页面,那么