不同样本的各功能群落的香农指数(Shannon)和辛普森指数(Simpson)的计算(Python)

不同样本的各功能群落的香农指数(Shannon)和辛普森指数(Simpson)的计算(Python)

生物多样性指数是描述生态系统中物种多样性的重要指标,其中香农指数(Shannon Index)辛普森指数(Simpson Index)是两个经典的测量方法。香农指数反映了物种丰富度和均匀度,辛普森指数则更注重样本中占主导地位的物种对多样性的影响。

本文通过 Python 示例讲解如何计算不同样本中各功能群落的香农指数和辛普森指数,同时配以图解和详细说明,帮助你轻松理解与实践。


一、理论基础

1. 香农指数(Shannon Index)

香农指数公式如下:

\[ H = -\sum_{i=1}^S p_i \ln(p_i) \]
  • (S):样本中的物种总数。
  • (p_i):第 (i) 种物种的相对丰度,即 (p_i = \frac{n_i}{N}),其中 (n_i) 是第 (i) 种物种的个体数,(N) 是总个体数。

2. 辛普森指数(Simpson Index)

辛普森指数公式如下:

\[ D = 1 - \sum_{i=1}^S p_i^2 \]
  • (D):多样性指数,数值越大表示多样性越高。

两者的核心思想均是基于物种的相对丰度计算。


二、准备数据

我们以一个假设数据集为例,该数据集中包含三个样本,每个样本中有不同物种的丰度值。

import pandas as pd

# 假设数据集
data = {
    "Sample": ["Sample1", "Sample2", "Sample3"],
    "Species_A": [10, 0, 15],
    "Species_B": [20, 5, 5],
    "Species_C": [30, 10, 0],
    "Species_D": [40, 85, 30]
}

# 转换为 DataFrame
df = pd.DataFrame(data)
df.set_index("Sample", inplace=True)
print(df)

数据表如下:

SampleSpecies_ASpecies_BSpecies_CSpecies_D
Sample110203040
Sample2051085
Sample3155030

三、计算香农指数(Shannon Index)

以下代码展示如何计算香农指数:

import numpy as np

def calculate_shannon_index(row):
    # 转换为相对丰度
    proportions = row / row.sum()
    # 滤除零值以避免 log(0) 的错误
    proportions = proportions[proportions > 0]
    # 计算香农指数
    shannon_index = -np.sum(proportions * np.log(proportions))
    return shannon_index

# 对每个样本计算香农指数
df["Shannon_Index"] = df.apply(calculate_shannon_index, axis=1)
print(df[["Shannon_Index"]])

输出结果

SampleShannon_Index
Sample11.27985
Sample20.61086
Sample31.03972

四、计算辛普森指数(Simpson Index)

以下代码展示如何计算辛普森指数:

def calculate_simpson_index(row):
    # 转换为相对丰度
    proportions = row / row.sum()
    # 计算辛普森指数
    simpson_index = 1 - np.sum(proportions ** 2)
    return simpson_index

# 对每个样本计算辛普森指数
df["Simpson_Index"] = df.apply(calculate_simpson_index, axis=1)
print(df[["Simpson_Index"]])

输出结果

SampleSimpson_Index
Sample10.69500
Sample20.20905
Sample30.61111

五、数据可视化

为了更直观地对比不同样本的香农指数和辛普森指数,我们使用 Matplotlib 绘制条形图。

import matplotlib.pyplot as plt

# 可视化
x = df.index
shannon = df["Shannon_Index"]
simpson = df["Simpson_Index"]

fig, ax = plt.subplots(1, 2, figsize=(12, 5))

# 绘制香农指数
ax[0].bar(x, shannon, color='skyblue')
ax[0].set_title("Shannon Index")
ax[0].set_ylabel("Index Value")
ax[0].set_xlabel("Samples")

# 绘制辛普森指数
ax[1].bar(x, simpson, color='lightgreen')
ax[1].set_title("Simpson Index")
ax[1].set_ylabel("Index Value")
ax[1].set_xlabel("Samples")

plt.tight_layout()
plt.show()

图示

  • 左图(香农指数):显示各样本物种多样性的均匀性和丰富性。
  • 右图(辛普森指数):反映样本中占主导物种对多样性的影响。

六、结果分析

  1. Sample1

    • 香农指数较高,说明物种丰富且分布较均匀。
    • 辛普森指数较高,说明没有某种物种过度占主导。
  2. Sample2

    • 香农指数较低,说明物种丰富度低且分布不均。
    • 辛普森指数最低,主要由物种 D 占据绝大多数丰度导致。
  3. Sample3

    • 香农指数和辛普森指数介于 Sample1 和 Sample2 之间,物种丰富度适中。

七、总结

通过本教程,我们学会了如何用 Python 计算不同样本的香农指数和辛普森指数,并借助数据可视化直观呈现结果:

  • 香农指数适合评估物种的均匀性和丰富度。
  • 辛普森指数更注重主导物种对多样性的影响。

两者结合使用,可以更全面地分析样本的多样性特征。在实际生态学和生物统计分析中,这些工具将发挥重要作用。

希望本教程对你有所帮助!如果有其他问题或想了解的内容,欢迎随时交流!

评论已关闭

推荐阅读

DDPG 模型解析,附Pytorch完整代码
2024年11月24日
DQN 模型解析,附Pytorch完整代码
2024年11月24日
AIGC实战——Transformer模型
2024年12月01日
Socket TCP 和 UDP 编程基础(Python)
2024年11月30日
python , tcp , udp
如何使用 ChatGPT 进行学术润色?你需要这些指令
2024年12月01日
AI
最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)
2024年11月24日
ChatGPT 和 DALL·E 2 配合生成故事绘本
2024年12月01日
omegaconf,一个超强的 Python 库!
2024年11月24日
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
2024年12月01日
[超级详细]如何在深度学习训练模型过程中使用 GPU 加速
2024年11月29日
Python 物理引擎pymunk最完整教程
2024年11月27日
MediaPipe 人体姿态与手指关键点检测教程
2024年11月27日
深入了解 Taipy:Python 打造 Web 应用的全面教程
2024年11月26日
基于Transformer的时间序列预测模型
2024年11月25日
Python在金融大数据分析中的AI应用(股价分析、量化交易)实战
2024年11月25日
AIGC Gradio系列学习教程之Components
2024年12月01日
Python3 `asyncio` — 异步 I/O,事件循环和并发工具
2024年11月30日
llama-factory SFT系列教程:大模型在自定义数据集 LoRA 训练与部署
2024年12月01日
Python 多线程和多进程用法
2024年11月24日
Python socket详解,全网最全教程
2024年11月27日