Metadata-Version: 2.1
Name: ctrip_spider
Version: 1.1.5
Summary: 携程爬虫(破解eleven, 发现ctrip_ticket).
Home-page: https://github.com/yanjlee/ctrip_spider
Author: yanjlee
Author-email: yanjlee@163.com
Classifier: Programming Language :: Python :: 3
Classifier: License :: OSI Approved :: MIT License
Classifier: Operating System :: OS Independent
Description-Content-Type: text/markdown
License-File: LICENSE
Requires-Dist: requests
Requires-Dist: faker
Requires-Dist: execjs
Requires-Dist: loguru
Requires-Dist: base64
Requires-Dist: hashlib
Requires-Dist: Crypto
Requires-Dist: pandas
Requires-Dist: fuzzywuzzy
Requires-Dist: httpx
Requires-Dist: Pillow
Requires-Dist: playwright
Requires-Dist: PyExecJS
Requires-Dist: redis
Requires-Dist: fastapi
Requires-Dist: uvicorn
Requires-Dist: APScheduler
Requires-Dist: beautifulsoup4
Requires-Dist: bs4
Requires-Dist: certifi
Requires-Dist: clickhouse-driver
Requires-Dist: curl-cffi
Requires-Dist: DrissionPage
Requires-Dist: fake-useragent
Requires-Dist: Flask
Requires-Dist: Flask-APScheduler
Requires-Dist: Flask-Cors
Requires-Dist: frida
Requires-Dist: gevent
Requires-Dist: httpx
Requires-Dist: Jinja2
Requires-Dist: langchain
Requires-Dist: langchain-community
Requires-Dist: suiutils-py

# 携程爬虫(破解eleven, 发现ctrip_ticket)
**使用时先跑'gen_ticket.py'生成ctrip_ticket，再跑'main.py'** <br />
破解eleven参数后，可以不需要调用selenium便可请求到详细的价格信息，提升获取速度、减少资源占用 <br />
该爬虫可爬取：
* 每个酒店名称、评分
* 每个酒店不同预订时间每种房型价格
* 每个酒店不同预订时间每种房型满意度
* 每个酒店不同预订时间每种房型剩余可订数 <br />
## 1. 获得房间价格的重要参数"eleven"的生成方法
* "eleven"由一个混淆js文件-"oceanball"生成，该文件具有随机性
* 生成方法:ctrip_funcs.py中的"get_oceanball"、"get_eleven"两个函数，需要配合js代码和python共同生成
## 2. 发现获得剩余可订房间仅需要Cookie: ctrip_ticket
* 这个cookie疑似使用“Http-only”Flag 发送，无法直接读取，只能通过浏览器获得。([reference](https://stackoverflow.com/questions/1022112/why-doesnt-document-cookie-show-all-the-cookie-for-the-site))
* 该cookie时效较长，可以用selenium每30分钟提取一次
