标签 python 下的文章

2024-08-11

在Python中，有许多库可以用于不同的目的，例如数据科学，机器学习，网络爬虫等。下面是一些常见的Python库：

NumPy：NumPy是Python的一个扩展库，主要用于处理大型多维数组和矩阵。它还提供了许多高级的数学函数来操作这些数组。
Pandas：Pandas是一个强大的数据分析和操作的库。它提供了丰富的数据结构和操作这些数据结构的函数。
Matplotlib：Matplotlib是Python的2D绘图库，它可以与NumPy结合使用，提供了一种数据可视化的方法。
Seaborn：Seaborn是一个基于matplotlib的可视化库，专门为制作更加具有吸引力的图表而设计。
Scikit-learn：Scikit-learn是一个Python库，提供了一系列的有监督和无监督学习算法。
Requests：Requests是一个简单易用的HTTP库，用于发送HTTP请求。
BeautifulSoup：BeautifulSoup是一个用于解析HTML和XML文件的库，可以用它来提取和操作网页中的数据。
Scrapy：Scrapy是一个用于网络爬虫的开源和高效的Python库。
TensorFlow：TensorFlow是一个用于数值计算的开源库，用于编写和执行机器学习算法。
Keras：Keras是一个用Python编写的开源库，用于设计深度学习模型。

下面是安装这些库的代码：




pip install numpy pandas matplotlib seaborn requests beautifulsoup4 scrapy tensorflow keras

安装完这些库后，你就可以开始你的库之旅了。在接下来的代码中，我们将使用这些库来创建一些基本的可视化和网络爬虫。

例如，使用Matplotlib创建一个简单的折线图：




import matplotlib.pyplot as plt
import numpy as np
 
# 生成数据
x = np.linspace(0, 10, 100)
y = np.sin(x)
 
# 绘制图像
plt.plot(x, y)
plt.show()

使用BeautifulSoup进行网页爬取：




import requests
from bs4 import BeautifulSoup
 
url = 'https://www.example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
 
# 提取所有的段落
paragraphs = soup.find_all('p')
for p in paragraphs:
    print(p.text)

使用Scrapy创建一个简单的网络爬虫：




import scrapy
 
class MySpider(scrapy.Spider):
    name = 'myspider'
    start_urls = ['https://www.example.com']
 
    def parse(self, response):
        for href in response.css('a::attr(href)'):
            yield response.follow(href, self.parse)

这只是每个库的一小部分功能，每个库都有更多的特性和用法。你可以通过阅读它们的官方文档来了解更多。

- 阅读更多 -

【Python】Tkinter模块（巨详细）

System

2024-08-11

所有,python

Tkinter是Python的标准GUI库。Tkinter的使用主要分为以下几个步骤：

导入Tkinter模块
创建GUI窗口
在窗口内添加组件
进入事件循环

以下是一个简单的Tkinter示例代码：




import tkinter as tk
 
# 创建一个窗口
window = tk.Tk()
 
# 给窗口设置标题
window.title("Hello Tkinter")
 
# 创建一个标签，并将其添加到窗口上
label = tk.Label(window, text="Hello, Tkinter!")
label.pack()
 
# 开始Tkinter的事件循环
window.mainloop()

在这个例子中，我们首先导入了tkinter模块，并创建了一个窗口。然后，我们创建了一个Label标签，并将其添加到窗口上。最后，我们调用了窗口的mainloop方法，这个方法会处理用户的交互操作，并更新GUI。

Tkinter提供了多种组件，如按钮(Button)，文本框(Entry)，标签(Label)，画布(Canvas)等，可以用来创建各种各样的GUI界面。

以下是一个简单的登录窗口的例子：




import tkinter as tk
 
def login():
    username = entry_username.get()
    password = entry_password.get()
    if username == "admin" and password == "password":
        label_login_status.config(text="Login successful!", fg="green")
    else:
        label_login_status.config(text="Login failed!", fg="red")
 
window = tk.Tk()
window.title("Login")
 
label_username = tk.Label(window, text="Username:")
label_password = tk.Label(window, text="Password:")
label_username.pack()
label_password.pack()
 
entry_username = tk.Entry(window)
entry_password = tk.Entry(window, show="*")  # show="*" 表示密码字段
entry_username.pack()
entry_password.pack()
 
button_login = tk.Button(window, text="Login", command=login)
button_login.pack()
 
label_login_status = tk.Label(window, text="")
label_login_status.pack()
 
window.mainloop()

在这个例子中，我们创建了一个登录窗口，用户可以在其中输入用户名和密码。当用户点击登录按钮时，程序会检查输入的用户名和密码是否正确，并在登录状态标签中显示相应的信息。

Tkinter提供的组件和方法非常丰富，可以用来创建各种复杂的GUI应用程序。

System

2024-08-11

所有,python




import tkinter as tk
 
def create_widgets(root):
    # 使用 Pack 布局管理器
    label1 = tk.Label(root, text='Pack 布局', font='Arial 12 bold')
    label1.pack(padx=10, pady=10)
 
    button1 = tk.Button(root, text='Button1')
    button1.pack(padx=10, pady=10)
 
    button2 = tk.Button(root, text='Button2')
    button2.pack(padx=10, pady=10)
 
    # 使用 Grid 布局管理器
    label2 = tk.Label(root, text='Grid 布局', font='Arial 12 bold')
    label2.grid(row=0, column=0, padx=10, pady=10)
 
    button3 = tk.Button(root, text='Button3')
    button3.grid(row=1, column=0, padx=10, pady=10)
 
    button4 = tk.Button(root, text='Button4')
    button4.grid(row=1, column=1, padx=10, pady=10)
 
    # 使用 Place 布局管理器
    label3 = tk.Label(root, text='Place 布局', font='Arial 12 bold')
    label3.place(x=150, y=200, anchor='nw')
 
    button5 = tk.Button(root, text='Button5')
    button5.place(x=250, y=220, anchor='nw')
 
    button6 = tk.Button(root, text='Button6')
    button6.place(x=350, y=220, anchor='ne')
 
 
root = tk.Tk()
root.title('布局管理器示例')
create_widgets(root)
root.mainloop()

这段代码展示了如何在Tkinter中使用Pack、Grid和Place三种布局管理器来排列界面上的控件。每一种布局管理器都有其特定的使用场景，例如Pack适合垂直或水平排列控件，Grid适合需要复杂行列布局的场景，而Place则提供了最为自由的控件定位方式。在实际应用中，开发者可以根据界面设计选择合适的布局管理器。

- 阅读更多 -

【python】六个常见爬虫案例

System

2024-08-11

所有,python

爬虫是一种自动提取网页数据的程序，Python 是实现爬虫的常用语言之一。下面是六个常见的 Python 爬虫案例及其源代码。

使用requests和BeautifulSoup库爬取简单网页：




import requests
from bs4 import BeautifulSoup
 
url = 'http://example.com'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
print(soup.prettify())

使用Scrapy框架爬取复杂网页：




import scrapy
 
class MySpider(scrapy.Spider):
    name = 'example'
    start_urls = ['http://example.com']
 
    def parse(self, response):
        for href in response.css('a::attr(href)'):
            yield response.follow(href, self.parse)

使用Selenium和PhantomJS进行JavaScript渲染的网页爬取：




from selenium import webdriver
 
driver = webdriver.PhantomJS()
driver.get('http://example.com')
print(driver.page_source)
driver.quit()

使用pymysql将爬取的数据存入MySQL数据库：




import pymysql
 
conn = pymysql.connect(host='localhost', user='user', password='passwd', db='db', charset='utf8')
cur = conn.cursor()
 
sql = "INSERT INTO example (column) VALUES (%s)"
cur.execute(sql, data)
 
conn.commit()
cur.close()
conn.close()

使用aiohttp异步库爬取网页（适合处理大量网页）：




import aiohttp
 
async def fetch(session, url):
    async with session.get(url) as response:
        return await response.text()
 
async def main():
    async with aiohttp.ClientSession() as session:
        html = await fetch(session, 'http://example.com')
        print(html)
 
import asyncio
asyncio.get_event_loop().run_until_complete(main())

使用redis-py将爬虫队列和设置去重存储在Redis数据库：




import redis
from scrapy.utils.project import get_project_settings
 
settings = get_project_settings()
redis_key = settings['REDIS_ITEM_KEY']
 
redis_conn = redis.StrictRedis(host='localhost', port=6379, db=0)
 
def process_item(item):
    redis_conn.lpush(redis_key, item)
    return item

这些例子提供了不同的爬虫方法和技术，可以根据实际需求选择合适的方案。

System

2024-08-11

所有,python

自动化抢票脚本通常涉及模拟登录、检测票务页面、识别验证码、自动下单等复杂操作。以下是一个简化的Python脚本框架，用于自动化抢票流程：




import requests
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
 
# 用户自定义的登录信息和选择的演唱会信息
your_username = "your_username"
your_password = "your_password"
concert_id = "concert_id"  # 演唱会ID
 
# 初始化WebDriver
driver = webdriver.Chrome()
 
try:
    # 访问大麦网主页
    driver.get("https://www.damai.cn")
 
    # 模拟登录流程
    # 找到用户名和密码输入框，输入登录信息
    username_input = driver.find_element(By.ID, "loginName")
    password_input = driver.find_element(By.ID, "loginPassword")
    username_input.send_keys(your_username)
    password_input.send_keys(your_password)
    password_input.send_keys(Keys.RETURN)
 
    # 等待登录成功
    # ...
 
    # 访问门票页面
    driver.get(f"https://www.damai.cn/concert/buy.jsp?productId={concert_id}")
 
    # 检测是否有票，有的话进行下单流程
    # ...
 
    # 识别验证码
    # ...
 
    # 自动下单
    # ...
 
finally:
    # 关闭浏览器
    driver.quit()

注意：由于自动化抢票可能违反大麦网的使用条款，请勿用于非法目的。此代码只为教学展示自动化流程的基本框架，实际使用时需要完善各个环节的具体实现。

- 阅读更多 -

Python酷库之旅-第三方库Pandas(018)

System

2024-08-11

所有,python




import pandas as pd
 
# 创建一个简单的DataFrame
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [28, 23, 34, 29]}
df = pd.DataFrame(data)
 
# 打印DataFrame
print(df)
 
# 将DataFrame导出到CSV文件
df.to_csv('output.csv', index=False)
 
# 从CSV文件读取数据到新的DataFrame
df_from_csv = pd.read_csv('output.csv')
 
# 打印新的DataFrame
print(df_from_csv)

这段代码展示了如何使用pandas库创建一个简单的DataFrame，并将其导出为CSV文件，然后再从CSV文件读取数据到新的DataFrame。这个过程是数据处理和分析的常见步骤，pandas库提供了很好的支持。

- 阅读更多 -

【Python从入门到进阶】Mysql防止SQL注入及ORM库简化操作

System

2024-08-11

所有,mysql




from pymysql import connect
 
# 使用pymysql连接数据库并执行查询操作，防止SQL注入
def safe_query(sql, params):
    # 连接数据库
    connection = connect(host='localhost',
                         user='user',
                         password='password',
                         database='dbname',
                         charset='utf8mb4',
                         cursorclass=DictCursor)
    
    try:
        with connection.cursor() as cursor:
            # 执行SQL语句
            cursor.execute(sql, params)
            # 获取所有结果
            result = cursor.fetchall()
            print(result)
    finally:
        connection.close()
 
# 示例SQL和参数
sql = "SELECT * FROM some_table WHERE column = %s;"
params = ('value',)
 
safe_query(sql, params)

这段代码使用了pymysql库来安全地执行SQL查询，防止了SQL注入攻击。通过使用参数化的查询，用户提供的值被安全地传递给数据库，不被解释为SQL代码的一部分。这是一个良好的编程习惯，应该在开发过程中被广泛采用。

- 阅读更多 -

(升级)Python+Flask+pymysql实现简单的登录注册

System

2024-08-11

所有,mysql




from flask import Flask, request, jsonify
import pymysql
 
app = Flask(__name__)
 
# 连接数据库
connection = pymysql.connect(host='localhost',
                             user='your_username',
                             password='your_password',
                             database='your_database',
                             charset='utf8mb4',
                             cursorclass=pymysql.cursors.DictCursor)
 
@app.route('/register', methods=['POST'])
def register():
    data = request.get_json()
    username = data['username']
    password = data['password']
    
    with connection.cursor() as cursor:
        # 创建 SQL 查询语句
        sql = "INSERT INTO `users`(`username`, `password`) VALUES (%s, %s)"
        cursor.execute(sql, (username, password))
        connection.commit()
        return jsonify({'message': 'User registered successfully', 'username': username}), 201
 
@app.route('/login', methods=['POST'])
def login():
    data = request.get_json()
    username = data['username']
    password = data['password']
    
    with connection.cursor() as cursor:
        # 创建 SQL 查询语句
        sql = "SELECT * FROM `users` WHERE `username` = %s AND `password` = %s"
        cursor.execute(sql, (username, password))
        user = cursor.fetchone()
        
        if user:
            return jsonify({'message': 'Logged in successfully', 'username': username}), 200
        else:
            return jsonify({'message': 'Invalid credentials'}), 401
 
if __name__ == '__main__':
    app.run(debug=True)

在这个示例中，我们使用了pymysql库来连接MySQL数据库，并且实现了简单的登录和注册功能。这个示例假设你的数据库中有一个名为users的表，它至少包含username和password字段。记得替换数据库连接的host、user、password和database为你自己的数据库信息。

- 阅读更多 -

对比Golang爬虫和Python爬虫：技术选用、性能差异和应用领域评估

System

2024-08-11

所有,golang

在选择Golang还是Python进行网络爬虫开发时，主要考虑以下几个方面：

技术栈：如果团队已经熟悉Python，保持一致性可能更重要。如果团队计划使用Golang进行全栈开发，那么使用Golang可能更为合适。
性能：在高并发和低延迟的场景下，Golang的性能可能更优越。Goroutine和channel 提供的轻量级线程和通信机制，能够高效地利用系统资源。
生态环境：Python拥有丰富的库和工具，比如Scrapy，而Golang则在网络通信和并发处理上有优势。
学习曲线：Python更易于学习，Golang对于系统程序员更为友好。

以下是两种语言简单爬虫的代码示例：

Python 爬虫示例（使用requests）:




import requests
 
def fetch_page(url):
    response = requests.get(url)
    if response.status_code == 200:
        return response.text
    else:
        return "Error fetching the page"
 
url = "http://example.com"
print(fetch_page(url))

Golang 爬虫示例（使用http包）:




package main
 
import (
    "fmt"
    "io/ioutil"
    "net/http"
)
 
func fetchPage(url string) (string, error) {
    resp, err := http.Get(url)
    if err != nil {
        return "", err
    }
    defer resp.Body.Close()
 
    body, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        return "", err
    }
 
    return string(body), nil
}
 
func main() {
    url := "http://example.com"
    page, err := fetchPage(url)
    if err != nil {
        fmt.Println(err)
    } else {
        fmt.Println(page)
    }
}

在实际选择时，需要考虑项目需求、团队技术栈、性能要求和长期维护等因素。

- 阅读更多 -

python爬虫入门，轻松爬取网页上的数据(非常详细)

System

2024-08-11

所有,php




import requests
from bs4 import BeautifulSoup
 
# 目标网页URL
url = 'http://example.com/'
 
# 发送HTTP请求
response = requests.get(url)
 
# 检查请求是否成功
if response.status_code == 200:
    # 使用BeautifulSoup解析网页内容
    soup = BeautifulSoup(response.text, 'html.parser')
    
    # 提取数据
    # 例如，提取所有的段落文本
    paragraphs = soup.find_all('p')
    for p in paragraphs:
        print(p.get_text())
 
# 注意：以上代码仅为示例，请根据实际网页结构调整选择器。

这段代码使用了requests库来发送HTTP GET请求，获取网页内容，并使用BeautifulSoup库来解析HTML，提取特定元素的文本。这是Python爬虫的基本步骤，适用于入门级别的教学。在实际应用中，可能需要处理更复杂的情况，如处理AJAX动态加载的内容、处理登录验证、处理图片、视频等多媒体内容，以及遵守robots.txt协议和其他网络道德规范。

- 阅读更多 -