python

当前位置:中华考试网 >> python >> python爬虫 >> 文章内容

爬虫数据如何保存到mongoDB?

来源:中华考试网  [2020年10月20日]  【

  爬虫数据保存到mongoDB的方法:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

import pymongo

 

# 首先需要注意,mongodb数据库存储的类型是以键值对类型进行存储,所以在存储以前一定要进行数据筛选

 

def save_mongo(传入的数据):

 

  # 创建连接 因为使用的为本机数据库,所以IP写localhost即可,端口号为27017

 

  client = pymongo.MongoClient('localhost',27017)

 

  # 连接数据库(这里注意一点,mongo数据库有一个优点,就是当自己连接的数据库和表都没有的时候,会自动创建,所以不用担心写错或者没有表)

 

  db = client['自己创建数据库名']

 

  # 连接表

 

  collection = db['自己的表名(mongo中叫做集合)']

 

  # 插入到数据库中(这里使用dict进行强制转换,是为了保证数据为字典格式)

 

  collection.insert(dict(传入的数据))

  mongoDB介绍:

  它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有:

  *面向集合存储,易存储对象类型的数据。

  *模式自由。

  *支持动态查询。

  *支持完全索引,包含内部对象。

  *支持查询。

  *支持复制和故障恢复。

  *使用高效的二进制数据存储,包括大型对象(如视频等)。

  *自动处理碎片,以支持云计算层次的扩展性。

  *支持 Golang,RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。

  *文件存储格式为BSON(一种JSON的扩展)。

  *可通过网络访问。

责编:fushihao
  • 会计考试
  • 建筑工程
  • 职业资格
  • 医药考试
  • 外语考试
  • 学历考试