初次提交

2025-08-24 21:46:22 +08:00
commit 481ebd15ea
4 changed files with 493 additions and 0 deletions
--- a/main.old.py
+++ b/main.old.py
@ -0,0 +1,113 @@
+
+###########
+#弃用！！！#
+###########
+
+import os
+import requests
+import time
+from random import randint
+import json
+import logging
+from rich.logging import RichHandler
+from rich.progress import track
+
+
+FORMAT = "%(message)s"
+logging.basicConfig(
+	level=logging.INFO, format=FORMAT, datefmt=None, handlers=[RichHandler(show_time=False,keywords=[''],markup=True)]
+)
+log = logging.getLogger("rich")
+
+myproxies = {
+	"http": "http://192.168.2.239:7890",
+	"https": "http://192.168.2.239:7890"
+	}
+mycookie = "first_visit_datetime_pc=2023-07-09+16%3A36%3A43; p_ab_id=0; p_ab_id_2=0; p_ab_d_id=1546119166; yuid_b=ISRDhpM; __utmz=235335808.1688888217.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none); _gcl_au=1.1.758440174.1688888274; device_token=cd254c3faa2d85d226b479644bebefb6; privacy_policy_agreement=6; c_type=22; privacy_policy_notification=0; a_type=0; b_type=1; _fbp=fb.1.1688888504522.781082674; _im_vid=01H4WSKMKKX6FYDSKKS91H7654; tag_view_ranking=U-RInt8VSZ~_EOd7bsGyl~XDEWeW9f9i~GHSY1lQ6BT~eInvgwdvwj~QwUeUr8yRJ~Lt-oEicbBr~SSHA4tH2AF~eVxus64GZU~99-dVV-h9A~JrZT530U46~ziiAzr_h04~TqiZfKmSCg~HiL-9b6O9S~XwbsX1-yIW~K4i6oXZcrP; login_ever=yes; __utmv=235335808.|2=login%20ever=yes=1^3=plan=normal=1^5=gender=male=1^6=user_id=78817947=1^9=p_ab_id=0=1^10=p_ab_id_2=0=1^11=lang=zh=1; __utma=235335808.877261409.1688888217.1689434637.1689523377.4; __utmc=235335808; _gid=GA1.2.1996568828.1689523397; QSI_S_ZN_5hF4My7Ad6VNNAi=v:0:0; cto_bundle=v_83tV9PM1NOcHg3ejU3ZG5wRXh2eTlVU0VzR1VUNTlHYjJZWlFHNyUyRnFOcHpSazklMkZSJTJGMWJMcUxWJTJCejRMeGNtcUsxT0hvZHZBZXdDNWZPTVV0Tmpqc3poJTJGZ1ozempDSHpyUFZhdjU1RmNIa25RSUxEbVljTDFoYXNKV1lnQldheEp6M09qeERQNkIwcDdqdHNkSkx4MjJyS0hBJTNEJTNE; __utmt=1; __cf_bm=_vP59fp_.Gfi5fDMOPb0IPYwi0ODGfkt.k8uOw6DV3o-1689524138-0-AWJtgxyJSZnlvRJorZR9Arq9mudtu0nU2J/bAhRaaixfi6Ms1PT7OV7fpR7NjpebeiyOs2FSPWK9A+NxEToWcfHNo5ZNZQ6ae65FpjZD2m4fYc8F2mOcVuRVIuk17UOAUw==; PHPSESSID=78817947_iQRWjLrRxNchsTU55lHb71EQydPPbxhN; _ga_MZ1NL4PHH0=GS1.1.1689524166.3.1.1689524182.0.0.0; __utmb=235335808.15.9.1689523418915; _ga_75BBYNYN9J=GS1.1.1689523376.4.1.1689524195.0.0.0; _ga=GA1.2.1339421325.1688888218"
+
+header = {
+	"content-type": "application/json",
+	"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36",
+	"accept-language": "zh-CN,zh;q=0.9",
+	"sec-fetch-dest": "empty",
+	"sec-fetch-mode": "cors",
+	"sec-fetch-site": "same-origin",
+	"content-type": "charset=UTF-8",
+
+}
+
+class DownloadArtworks():
+	def __init__(self,illust_id) -> None:
+		self.illust_id = str(illust_id)
+		#urls = self.get_img_url()
+		#self.download_images(data=urls)
+
+	def get_img_url(self):
+		url = "https://www.pixiv.net/ajax/illust/{}/pages"
+		img_list = []
+		response = requests.get(url=url.format(self.illust_id), headers=header, proxies=myproxies)
+		log.info(response.status_code)
+		response = response.json()
+
+		if response['error']:
+			log.error("[{}] {}".format(self.illust_id, response['message']))
+			return False
+		else:
+			log.debug(response)
+			#self.save_data(response)
+			log.info("搜索插画作品[{}]".format(self.illust_id, len(response['body'])))
+			return response['body']
+	def get_artwork_metadata(self):
+		pass
+	def save_data(self, data, path='./data/'):
+		self.checkdirs(path=path)
+		filepath = path+self.illust_id+'.json'
+		log.debug("创建data文件[{}]".format(filepath))
+		with open(filepath, 'w') as f:
+			json.dump(data, f, indent=4)
+			f.close()
+	def checkdirs(self, path):
+		if os.path.exists(path) != True:
+			os.makedirs(path)
+			log.warn("文件夹[{}]不存在，已自动创建".format(path))
+		else:
+			log.debug("文件夹[{}]已存在".format(path))
+
+
+	def download_images(self, data:list):
+		header = {
+		"accept": "image/avif,image/webp,image/apng,image/*,*/*;q=0.8",
+		"referer": "https://www.pixiv.net/artworks/{}".format(self.illust_id),
+		"sec-fetch-dest": "image",
+		"sec-fetch-mode": "no-cors",
+		"sec-fetch-site": "cross-site",
+		"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36",
+		}
+
+		num = 0
+		for urls_data in data:
+			urls = urls_data['urls']
+			for url_data in track(urls.items(), description='下载图片中. . .',refresh_per_second=2):#遍历字典
+				for num_try in range(1,1000):#如果出错，重试5次
+					try:
+						response = requests.get(url=url_data[1], headers=header, proxies=myproxies)
+						break
+					except:
+						log.error("下载错误，第{}次尝试下载".format(num_try))
+						time.sleep(randint(2,8))
+
+				self.checkdirs(".\img\{}".format(url_data[0]))
+				filepath = ".\img\{}\{}".format(url_data[0],os.path.basename(url_data[1]))
+				with open(filepath, "wb") as f:
+					f.write(response.content)
+					f.close()
+				num+=1
+				log.info("已成功下载图片[[blue]{}[/]]，存储目录[[blue]{}[/]]".format(os.path.basename(url_data[1]),filepath))
+		log.info("插画作品[[blue]{}[/]][green]下载完成！[/]共下载[yellow]{}[/]张插画".format(self.illust_id, num))
+	
+
+p = [87405084,95084979]
+for i in p:
+	# DownloadArtworks(illust_id=i)
+	time.sleep(randint(2,8))
+