<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
  <channel>
    <title>风智方舟 - 自然语言处理</title>
    <link>https://www.9d88.com/forum-3-1.html</link>
    <description>Latest 20 threads of 自然语言处理</description>
    <copyright>Copyright(C) 风智方舟</copyright>
    <generator>Discuz! Board by Comsenz Inc.</generator>
    <lastBuildDate>Mon, 27 Apr 2026 07:42:18 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>https://www.9d88.com/static/image/common/logo_88_31.gif</url>
      <title>风智方舟</title>
      <link>https://www.9d88.com/</link>
    </image>
    <item>
      <title>【向量库】FAISS向量库的介绍和基本使用（增删改查）</title>
      <link>https://www.9d88.com/thread-72-1-1.html</link>
      <description><![CDATA[[md]
&gt; ? 博主简介：曾任某智慧城市类企业`算法总监`，目前在美国市场的物流公司从事`高级算法工程师`一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨 ...]]></description>
      <category>自然语言处理</category>
      <author>云天徽上</author>
      <pubDate>Thu, 01 Aug 2024 02:09:45 +0000</pubDate>
    </item>
    <item>
      <title>【向量库】pinecone向量库的介绍和基本使用（增删改查）</title>
      <link>https://www.9d88.com/thread-71-1-1.html</link>
      <description><![CDATA[[md]![image.png](data/attachment/forum/202407/31/110917aq2wmsfmss2i1ymp.png)


Pinecone是一个实时、高性能的向量数据库，专为大规模向量集的高效索引和检索而设计。它提供亚秒级的查询响应时间，确保用户可以迅速获取所需信息。Pinecone采用高度可伸缩的分布式架 ...]]></description>
      <category>自然语言处理</category>
      <author>云天徽上</author>
      <pubDate>Wed, 31 Jul 2024 03:21:06 +0000</pubDate>
    </item>
    <item>
      <title>【NLP-05】数据标注：windows10部署doccano标注工具及使用</title>
      <link>https://www.9d88.com/thread-20-1-1.html</link>
      <description><![CDATA[[md]#### Step1.本地安装doccano（本地测试环境python=3.8）
- 先创建一个python3.8版本的虚拟环境，conda create -n doccano python==3.8  ;activate  doccano
- 再$ pip install doccano
#### Step2.初始化数据库和账户（用户名和密码可替换成自定义的值）
$ doccano  ...]]></description>
      <category>自然语言处理</category>
      <author>云天徽上</author>
      <pubDate>Wed, 12 Jun 2024 01:59:00 +0000</pubDate>
    </item>
    <item>
      <title>【NLP-04】tranformers库保姆级使用教程---以BERT模型为例</title>
      <link>https://www.9d88.com/thread-16-1-1.html</link>
      <description><![CDATA[[md]###  安装
要安装一个非常轻量级的Transformers库，您可以执行以下步骤：

- 1、打开终端或命令提示符。
- 2、运行以下命令来安装Transformers库：

```python
pip install transformers
```

这将使用pip工具从Python Package Index（PyPI）下载并安装Transformers ...]]></description>
      <category>自然语言处理</category>
      <author>云天徽上</author>
      <pubDate>Tue, 11 Jun 2024 03:44:00 +0000</pubDate>
    </item>
    <item>
      <title>【NLP-03】 文本表达---BERT、RoBERTa、GPT和OpenAI_embedding等模型</title>
      <link>https://www.9d88.com/thread-15-1-1.html</link>
      <description><![CDATA[[md]
&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;预训练模型在NLP领域的广泛应用为文本表示方法带来了巨大的革新。传统的词向量方法（如Word2Vec、GloVe等）主要基于固定的向量表示，而预训练模型则通过大规模语料库的训练，学习到了动态的、上下文相关的文本表 ...]]></description>
      <category>自然语言处理</category>
      <author>云天徽上</author>
      <pubDate>Tue, 11 Jun 2024 02:31:02 +0000</pubDate>
    </item>
    <item>
      <title>【NLP-02】文本表达---词袋模型、TF-IDF、Word2Vec、Doc2Vec、FastText和USE模型</title>
      <link>https://www.9d88.com/thread-14-1-1.html</link>
      <description><![CDATA[[md]### NLP的向量表达一般包含以下一些种类：

- 词袋模型：简单易实现，适用于文本分类等任务。但是由于忽略了单词的顺序和语义关系，所以在处理长文本或需要考虑单词含义的任务（如机器翻译）时可能效果不佳。
- TF-IDF模型：相比词袋模型更能反映单词在文章中的重要 ...]]></description>
      <category>自然语言处理</category>
      <author>云天徽上</author>
      <pubDate>Tue, 11 Jun 2024 02:29:16 +0000</pubDate>
    </item>
    <item>
      <title>【NLP-01】文本相似度算法：Cosine Similarity、Levenshtein Distance、Word2Vec等介</title>
      <link>https://www.9d88.com/thread-13-1-1.html</link>
      <description><![CDATA[[md]&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;文本相似度计算的算法是自然语言处理领域中的关键技术，主要用于衡量两段文本在内容、语义或结构上的相似程度。以下是一些常用的文本相似度计算算法：

![image.png](data/attachment/forum/202406/11/102706rnd9z ...]]></description>
      <category>自然语言处理</category>
      <author>云天徽上</author>
      <pubDate>Tue, 11 Jun 2024 02:27:14 +0000</pubDate>
    </item>
    <item>
      <title>【NLP-00】TF-IDF算法应用介绍</title>
      <link>https://www.9d88.com/thread-5-1-1.html</link>
      <description><![CDATA[[md]### 一、TF-IDF的介绍

TF-IDF（Term Frequency-Inverse Document Frequency）是一种用于衡量文本中某个词语重要程度的统计方法，它可以帮助我们确定每个词语在一个文档集合中的相对重要性。

TF-IDF由两部分组成：Term Frequency（词频）和Inverse Document Freque ...]]></description>
      <category>自然语言处理</category>
      <author>楽思蜀</author>
      <pubDate>Wed, 05 Jun 2024 09:05:24 +0000</pubDate>
    </item>
  </channel>
</rss>