import numpy as np
import pandas as pd
from sklearn.decomposition import PCA
from sklearn.svm import OneClassSVM
# 假设电力数据已经载入DataFrame df,并且df包含时间序列和电力使用数据
# 示例数据
df = pd.DataFrame({
'time': pd.date_range(start='2020-01-01', periods=1000, freq='H'),
'power': np.random.rand(1000) * 100
})
# 将时间序列转换为每日的平均功率
df['day'] = df['time'].dt.date
df_daily_mean = df.groupby('day')['power'].mean().reset_index()
# 使用PCA降维数据
pca = PCA(n_components=0.95) # 保留95%的能量
X_reduced = pca.fit_transform(df_daily_mean[['power']])
# 使用OneClassSVM进行负荷检测
ocsvm = OneClassSVM(kernel='rbf', gamma=0.1, nu=0.1)
y_pred = ocsvm.fit_predict(X_reduced)
# 筛选出可能的负荷点
threshold = -ocsvm.decision_function(X_reduced) * ocsvm.decision_function(X_reduced) > 1
anomalies = df_daily_mean[y_pred == -1]
# 打印结果
print(anomalies)
这段代码首先使用PCA降低数据的维度,然后使用OneClassSVM算法检测出异常点。这里的异常点是指在训练集中被OneClassSVM算法判断为"异常"的数据点,也就是我们认为的负荷。最后,我们通过阈值筛选出可能的负荷点并打印出来。这个过程是一个典型的非侵入式负荷检测与分解流程。