标签:python mongodb batch coll aaroom print 基本操作 listbacth
1.python 连接mongodb
import psycopg2
import datetime
from pymongo import MongoClient
#数据转移: AA连锁店数据抽取
#抽取过程: mongodb->postgres
def getNowBatch():
# 数据库mongodb
mongo = MongoClient("192.168.31.130", 27017)
db = mongo["crawlab_test"]
coll = db.get_collection('cp_cnexpo')
listbacth = coll.distinct("batch")
if len(listbacth):
pass#不为空
else:
return 1#为空
listbacth.sort()
batch=int(listbacth[-1])
print(listbacth,'本次批次号为=',batch)
return batch
def export():
# 数据库mongodb
mongo = MongoClient("IP", 27017)
db = mongo["databaseName"]#数据库名
coll = db.get_collection('collectionName')#集合名词
batchnum=getNowBatch()
print('batchnum=',batchnum)
#取出所有aaroom集合下的数据 "crawler.date" : {"$gte": datetime(2018, 11, 14)}
list_aaroom = coll.find({"batch":batchnum}, {"_id": 0,"event": 1, "type": 1, "event_time": 1, "city": 1,"insertdate": 1, "ptname": 1, "adress": 1})#查询指定字段poi_id": 1 表示查, poi_id": 0表示不查
#list_aaroom = coll.find({'batch':batchnum}) # 查询指定字段poi_id": 1 表示查, poi_id": 0表示不查
#print(list_aaroom)
listall=[]
for room in list_aaroom:
listitm = list(room.values())
listall.append(listitm)
print(listall)
#批量插入pg库
conn = psycopg2.connect(database="xxx", user="postgres", password="xxx",
host="ip", port="xxx")
print("Open database success")
cur = conn.cursor()
sql = "INSERT INTO crawl_hot_event(event, type, event_time, city, insertdate, ptname,adress) VALUES(%s,%s,%s,%s,%s,%s,%s)"
cur.executemany(sql, listall)
conn.commit()
print("中国展会网最新数据抽取到pg库")
conn.close()
if __name__ == '__main__':
export()
mongodb条件查询参考:https://www.cnblogs.com/liyujie1978/p/9542495.html
标签:python,mongodb,batch,coll,aaroom,print,基本操作,listbacth 来源: https://blog.csdn.net/kai402458953/article/details/100349472
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。