【鸿蒙抗衰 APP · 生命科学】KaiwuDB社区版时序数据库赋能：1 年心率数据高效存储与精准分析实践(数据已脱敏)

红目香薰

10361人浏览 · 2026-02-07 20:50:40

红目香薰 · 2026-02-07 20:50:40 发布

在这里插入图片描述

前言

在做【生命科学】抗衰 APP 的健康数据模块时，我们很快明确了一个核心需求：要长期追踪用户的生理节律（比如心率），还得高效存、快速查 —— 毕竟抗衰分析的核心是 “长期趋势”，不是单次数据。
所以数据库没选常用的关系型库，直接敲定了KWDB 时序数据库：它天然适配 “按时间节点存数据” 的场景，写入和查询效率比关系型库高了不止一个量级（实测 1 周数据的写入 + 可视化耗时仅为 MySQL 的 1/5）。
下面这张图，就是用它存的 1 周心率数据 —— 从 “各时段分布特征” 到 “24 小时全量监测图谱”，能清晰看到不同生理时段的心率规律。而我们的目标不止于此：后续要基于它分析1 年的连续数据，从 “短期节律” 挖到 “长期衰老相关的生理变化”，给用户的抗衰方案做更精准的科学支撑。

视频链接：https://www.bilibili.com/video/BV1kizRB9EE5/

注： KWDB是KaiwuDB的社区版本

24小时去敏数据分析——示例效果

下图为数据为1天的1440条数据监测的数据分析结果。
在这里插入图片描述

一、KWDB数据库准备

下面的这块内容均数据数据库准备阶段。

1.1、最新版本查找地址

https://gitee.com/kwdb/kwdb/releases/

1.2、测试环境

我用的Windows的Ubuntu22.04版本，很神奇是吧，后面我们会去适配鸿蒙的各类操作，所以以后你会发现更多更好玩的用法。

1.3、下载命令

wget https://foruda.gitee.com/attach_file/1770109950657531748/kwdb-3.1.0-ubuntu22.04-intel-x86_64-debs.tar.gz?token=6637de7fef170b322fa554cb13dddb53&ts=1770383245&attname=KWDB-3.1.0-ubuntu22.04-intel-x86_64-debs.tar.gz

1.4、下载完解压效果

解压命令：tar -zxvf 文件名。

1.5、操作文件夹说明

下面的操作都是在 cd kwdb_install/ 下操作的。

1.6、脚本说明：

先配置 deploy.cfg → 再执行 deploy.sh 完成安装 → 最后执行 add_user.sh 创建用户

deploy.sh（安装部署脚本）

这是第一步要执行的脚本，负责完成整个 KWDB 的安装、部署和基础启动工作。它会读取 deploy.cfg 里的配置信息，完成环境初始化、服务启停等核心操作。

deploy.cfg（配置文件）

它不是一个可执行脚本，而是在执行 deploy.sh 之前就需要准备好的配置文件。你需要先在里面填写好节点 IP、端口等信息，这样 deploy.sh 才能按照你的配置来部署。

add_user.sh（创建数据库用户脚本）

这是在 KWDB 安装启动成功后才执行的脚本，用于给数据库创建具体的用户账号，属于部署完成后的初始化步骤。

1.7、单节点安装过程

先配置，再确认，安装后测试连接。

1.7.1 配置deploy.cfg文件

配置效果如下

1.7.2 输入y确认安装

这里有缺失的包我们没安装，需要先安装一下。命令下面我也都给出来了。

1.7.3 缺失包补充

下载命令：

wget http://archive.ubuntu.com/ubuntu/pool/universe/g/gflags/libgflags2.2_2.2.2-2_amd64.deb

安装命令：

sudo dpkg -i libgflags2.2_2.2.2-2_amd64.deb

下载命令：

wget http://archive.ubuntu.com/ubuntu/pool/main/p/protobuf/libprotobuf23_3.12.4-1ubuntu7_amd64.deb

安装命令：

sudo dpkg -i libprotobuf23_3.12.4-1ubuntu7_amd64.deb

1.8、安装successfully效果

看到下图就安装成功了，别忘记PWD。

1.9、启动KWDB命令

命令在这：

./deploy.sh start

1.10、查看是否启动状态

命令：

./deploy.sh status

全局查看命令：

systemctl status kaiwudb

1.11、添加用户

命令：

./add_user.sh

1.12、命令行连接KWDB数据库

官方命令：./kwbase sql --certs-dir=/etc/kaiwudb/certs --host= -u

需要适当修改一下，因为我没配置证书，故而用sudo来升个权限：

sudo /usr/local/kaiwudb/bin/kwbase sql --host=127.0.0.1:26257 --certs-dir=/etc/kaiwudb/certs

使用具体的用户登录：

sudo /usr/local/kaiwudb/bin/kwbase sql --host=127.0.0.1:26257 --certs-dir=/etc/kaiwudb/certs --user=hongmuxiangxun

二、心率检测数据库与去敏数据准备

我们做个准备，然后才好去测试。

2.1、时序数据库创建

-- 1、创建数据库
CREATE DATABASE IF NOT EXISTS health_monitor;

-- 2、切换数据库
use health_monitor;

-- 3、创建心率时序表（KWDB支持原生时序索引）
CREATE TABLE IF NOT EXISTS heart_rate (
  user_id VARCHAR(64) NOT NULL,    -- 用户ID
  ts TIMESTAMP NOT NULL,           -- 采集时间戳
  heart_rate INT NOT NULL CHECK (heart_rate BETWEEN 60 AND 180), -- 心率值（加范围校验）
  device_id VARCHAR(64),           -- 设备ID
  upload_ts TIMESTAMP DEFAULT CURRENT_TIMESTAMP, -- 数据上传时间
  -- 时序核心索引：按用户+时间戳排序
  PRIMARY KEY (user_id, ts)
);

-- 4、 创建时序专用索引（KWDB优化，提升时间范围查询速度）
CREATE INDEX idx_heart_rate_ts ON heart_rate (ts);

-- 5、查询场景是「按用户 + 时间范围」查询心率数据，所以创建【复合索引】是最优选择：
CREATE INDEX idx_heart_rate_user_ts ON heart_rate (user_id, ts);

创建：

切换：

建表：

创建索引优化：

在 heart_rate 表上，为 ts（时间戳）字段创建一个名为 idx_heart_rate_ts 的默认BTREE类型索引。

2.2、索引与复合索引说明

查询场景是「按用户 + 时间范围」查询心率数据，所以创建复合索引是最优选择：

由于数据量不是很大，所以这里就不在乎数据库大小了。

2.3、python操作KWDB数据库

这里先安装一下psycopg2用这个来操作数据库。

初始状态：

快速导入数据：

psql -h 127.0.0.1 -p 26257 -U hongmuxiangxun -d heart_rate -f insert_heart_rate_data.sql

操作代码：

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
生命科学项目导向：SQL 脚本执行引擎
功能：读取并执行导出的 .sql 文件，用于时序数据的二次快速导入
"""

import psycopg2
import os
import time

def execute_sql_file(file_path):
    """读取并执行 SQL 文件中的所有指令"""
    if not os.path.exists(file_path):
        print(f"错误：找不到 SQL 文件 '{file_path}'。请先运行 sql_base.py 生成该文件。")
        return

    conn = None
    try:
        print(f"正在连接数据库并准备执行脚本: {file_path} ...")
        # 连接配置
        conn = psycopg2.connect(
            database="heart_rate", 
            user="hongmuxiangxun", 
            password="123456", 
            host="127.0.0.1",
            port="26257"
        )
        conn.autocommit = True
        cur = conn.cursor()

        print("正在读取 SQL 内容...")
        with open(file_path, 'r', encoding='utf-8') as f:
            sql_content = f.read()

        # KaiwuDB/PostgreSQL 支持通过 execute 直接执行包含多条语句的字符串
        print("正在执行 SQL 插入指令，请稍候...")
        start_time = time.time()
        
        cur.execute(sql_content)
        
        end_time = time.time()
        print(f"执行成功！")
        print(f"总耗时: {end_time - start_time:.2f} 秒")

        cur.close()
    except (Exception, psycopg2.Error) as error:
        print(f"执行 SQL 文件时发生错误:\n{error}")
        print("\n提示：请检查数据库中是否存在 'heart_rate' 表，或者是否需要切换 Schema。")
    finally:
        if conn:
            conn.close()
            print("连接已安全关闭。")

if __name__ == "__main__":
    # 执行生成的 SQL 脚本
    execute_sql_file("insert_heart_rate_data.sql")

插入数据1万条：

2.3、心率检测数据分析

代码：

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
生命科学项目导向：心率大数据图谱分析引擎
功能：从 KaiwuDB 读取时序数据，进行早、中、晚、夜间四个时段的统计建模与可视化分析
"""

import psycopg2
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import warnings
import time

# 1. 过滤不必要的警告信息，保持输出界面整洁
warnings.filterwarnings('ignore', category=UserWarning)
warnings.filterwarnings('ignore', category=FutureWarning)

# 设置中文字体支持（解决绘图乱码问题）
plt.rcParams['font.sans-serif'] = ['SimHei'] 
plt.rcParams['axes.unicode_minus'] = False

def fetch_ts_data():
    """从时序数据库获取全量监测数据"""
    conn = None
    try:
        print(" [系统] 正在建立与 KaiwuDB 时序引擎的连接...")
        conn = psycopg2.connect(
            database="health_monitor", 
            user="hongmuxiangxun", 
            password="123456", 
            host="172.29.204.142",
            port="26257"
        )
        query = "SELECT ts, heart_rate FROM heart_rate;"
        
        print(" [数据] 正在执行全量生理体征数据提取...")
        start_time = time.time()
        df = pd.read_sql(query, conn)
        end_time = time.time()
        
        print(f" [成功] 已从数据库加载 {len(df)} 条时序记录。")
        print(f" [性能] 数据库查询耗时: {end_time - start_time:.4f} 秒")
        return df
    except Exception as e:
        print(f" [错误] 数据提取失败: {e}")
        return None
    finally:
        if conn:
            conn.close()

def categorize_time_period(hour):
    """
    生理节律时段划分算法：
    05:00 - 11:00 -> 早晨 (Morning)
    11:00 - 17:00 -> 午后 (Afternoon)
    17:00 - 23:00 -> 晚上 (Evening)
    23:00 - 05:00 -> 夜间 (Night)
    """
    if 5 <= hour < 11:
        return "早晨 (05:00-11:00)"
    elif 11 <= hour < 17:
        return "午后 (11:00-17:00)"
    elif 17 <= hour < 23:
        return "晚上 (17:00-23:00)"
    else:
        return "夜间 (23:00-05:00)"

def generate_vital_spectrum(df):
    """构建心率大数据图谱"""
    print(" [建模] 正在进行 24 小时生理节律特征映射...")
    
    # 1. 时间维度工程
    df['ts'] = pd.to_datetime(df['ts'])
    df['hour'] = df['ts'].dt.hour
    df['period'] = df['hour'].apply(categorize_time_period)
    
    # 定义时段顺序
    period_order = ["早晨 (05:00-11:00)", "午后 (11:00-17:00)", "晚上 (17:00-23:00)", "夜间 (23:00-05:00)"]
    df['period'] = pd.Categorical(df['period'], categories=period_order, ordered=True)

    # 2. 绘制多维大数据图谱
    print(" [绘图] 正在生成多维心率大数据可视化图谱...")
    plt.figure(figsize=(15, 10))
    
    # 子图1：时段心率分布小提琴图
    plt.subplot(2, 2, 1)
    # 适配 Seaborn 新版本建议：明确指定 hue 以消除警告
    sns.violinplot(x='period', y='heart_rate', data=df, hue='period', palette="husl", inner="quart", legend=False)
    plt.title("心率时段分布特征（生理节律分析）", fontsize=14)
    plt.xlabel("生理时段")
    plt.ylabel("心率 (bpm)")
    plt.xticks(rotation=15)

    # 子图2：时段平均心率对比
    plt.subplot(2, 2, 2)
    # 适配 Pandas 新版本建议：明确设置 observed 参数
    period_avg = df.groupby('period', observed=False)['heart_rate'].mean()
    period_avg.plot(kind='bar', color='skyblue', alpha=0.8)
    plt.title("各时段平均心率水平", fontsize=14)
    plt.ylabel("平均心率 (bpm)")
    plt.ylim(60, 100)
    plt.xticks(rotation=15)

    # 子图3：全天心率波动散点热力图
    plt.subplot(2, 1, 2)
    plt.scatter(df['ts'], df['heart_rate'], alpha=0.3, s=5, c=df['hour'], cmap='coolwarm')
    plt.colorbar(label='小时 (24H制)')
    plt.title("24小时全量体征监测图谱", fontsize=14)
    plt.xlabel("监测时间")
    plt.ylabel("实时心率 (bpm)")
    
    plt.tight_layout()
    
    # 3. 保存与展示
    output_img = "heart_rate_spectrum.png"
    plt.savefig(output_img, dpi=300)
    print(f" [完成] 分析图谱已导出至当前目录: {output_img}")
    # plt.show() # 如果在无界面环境下可注释此行

def main():
    print("="*50)
    print("   生命科学：智慧医疗心率大数据分析引擎 v1.0")
    print("="*50)
    
    # 步骤1：数据提取
    raw_df = fetch_ts_data()
    
    if raw_df is not None and not raw_df.empty:
        # 步骤2：大数据图谱分析
        generate_vital_spectrum(raw_df)
    else:
        print(" [异常] 未获取到有效数据，请检查数据库连接或 heart_rate 表内容。")
    
    print("="*50)
    print("   分析任务结束。")

if __name__ == "__main__":
    main()

大数据分析结果：

heart_rate_spectrum
我们去找个AI分析一下。

三、心率检测表医学分析报告

以下为豆包进行图片分析后给出的报告。

## 一、整体心率节律特征
1. **24小时心率波动规律**
   - 心率随时间呈现明显的昼夜节律：夜间（00:00–05:00）心率偏低，白天逐渐升高，午后（11:00–17:00）趋于平稳，傍晚（17:00–23:00）再次小幅上升。
   - 该节律符合健康人群典型生理特征，提示交感与副交感神经调节功能基本正常。
2. **平均心率水平**
   - 四个时段平均心率均在74–75 bpm（次/分钟）左右，处于正常成人静息心率范围（60–100 bpm）的理想区间，基础心血管状态平稳。

## 二、分时段医学解读
### 1. 早晨（05:00–11:00）
- **分布特征**：心率分布范围最广（60–100+ bpm），整体水平略高于其他时段。
- **医学解读**：早晨为交感神经兴奋的“觉醒期”，心率生理性升高属于正常现象；无持续异常快速心率（＞100 bpm），排除晨起高血压、心律失常等风险。

### 2. 午后（11:00–17:00）
- **分布特征**：心率分布最集中，波动最小，中位数稳定在72–74 bpm。
- **医学解读**：午后身体处于稳定活动状态，心率平稳说明心血管系统可适应日常活动，无疲劳性心率升高，心功能储备良好。

### 3. 晚上（17:00–23:00）
- **分布特征**：心率分布略有拓宽，整体水平与午后接近。
- **医学解读**：傍晚交感神经再次活跃，心率小幅波动为正常生理反应，无异常心率漂移或心律失常表现。

### 4. 夜间（23:00–05:00）
- **分布特征**：心率整体最低，集中在60–80 bpm，深睡期心率有效降低。
- **医学解读**：夜间心率降低是副交感神经（迷走神经）占优的表现，心血管系统夜间休息状态良好；无夜间心率异常升高（＞80 bpm），排除睡眠呼吸暂停、心功能不全等风险。

## 三、综合医学结论
1. **节律正常**：24小时心率呈现清晰的昼夜节律，符合健康成年人生理模式；
2. **心率水平理想**：全天平均心率74–75 bpm，静息心率处于理想范围，心血管系统基础状态良好；
3. **无明显异常风险**：各时段心率无持续异常升高/降低，无心律失常、心肌缺血或自主神经功能紊乱的典型表现；
4. **睡眠心血管健康**：夜间心率有效降低，提示睡眠质量良好，心血管系统夜间得到充分休息。

四、一年脱敏数据引入分析

先清空一下数据，为后续的操作做个初始化。
在这里插入图片描述

4.1、导入一年数据-一年52周，大概52万余条

这里我准备了插入数据的语句，插入实测。
在这里插入图片描述

总时间消耗：52.56万条用时47.68秒，中间有几个卡到3秒的，不知道什么原因，可能是网络吧，不过我都是自己的局域网，这里回头得问问怎么回事，是不是用个数据库连接池解决这个问题。

疑问点-待解决

对了对了，没有数据库连接池的驱动也不行啊，不然长时间不用断开连接就无法操作数据也是一个问题。
在这里插入图片描述

4.2、对1年数据做数据做个时间段心率分析

单次对52万条数据做查询，消耗时间是2秒，毕竟我做了索引，还是很快的。
在这里插入图片描述
下面的5张图是具体的心率1天、1周、1月、1季度、1年的具体检测
分析源代码：

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
生命科学项目导向：多维心率大数据全生命周期分析引擎
功能：从 KaiwuDB 提取数据，并按 1天、1周、1月、1季度、1年五个时间跨度生成专业监测图谱
"""

import psycopg2
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime, timedelta
import warnings
import time
import os

# 1. 环境配置与警告过滤
warnings.filterwarnings('ignore', category=UserWarning)
warnings.filterwarnings('ignore', category=FutureWarning)

plt.rcParams['font.sans-serif'] = ['SimHei'] 
plt.rcParams['axes.unicode_minus'] = False

def fetch_all_data():
    """从 KaiwuDB 提取全量时序记录"""
    conn = None
    try:
        print(" [系统] 正在建立与 KaiwuDB 时序引擎的连接...")
        conn = psycopg2.connect(
            database="health_monitor", 
            user="hongmuxiangxun", 
            password="123456", 
            host="172.29.204.142",
            port="26257"
        )
        # 提取最近一年的全量数据
        query = "SELECT ts, heart_rate FROM heart_rate ORDER BY ts DESC;"
        
        print(" [数据] 正在执行全量生理体征数据提取...")
        start_time = time.time()
        df = pd.read_sql(query, conn)
        end_time = time.time()
        
        print(f" [成功] 已加载 {len(df)} 条记录。查询耗时: {end_time - start_time:.4f}s")
        return df
    except Exception as e:
        print(f" [错误] 数据提取失败: {e}")
        return None
    finally:
        if conn:
            conn.close()

def categorize_time_period(hour):
    """生理节律时段划分"""
    if 5 <= hour < 11:
        return "早晨"
    elif 11 <= hour < 17:
        return "午后"
    elif 17 <= hour < 23:
        return "晚上"
    else:
        return "夜间"

def generate_visual_report(df, label, filename):
    """为指定时间维度生成深度分析图谱"""
    if df.empty:
        print(f" [跳过] {label} 维度数据为空。")
        return

    print(f" [建模] 正在构建 {label} 维度体征图谱...")
    
    # 数据预处理
    df = df.copy()
    df['ts'] = pd.to_datetime(df['ts'])
    df['hour'] = df['ts'].dt.hour
    df['period'] = df['hour'].apply(categorize_time_period)
    
    period_order = ["早晨", "午后", "晚上", "夜间"]
    df['period'] = pd.Categorical(df['period'], categories=period_order, ordered=True)

    # 创建画布
    fig = plt.figure(figsize=(16, 10))
    fig.suptitle(f"生命体征大数据图谱 - 时间跨度：{label}", fontsize=20, fontweight='bold', y=0.95)

    # 1. 心率时段分布特征（小提琴图）
    plt.subplot(2, 2, 1)
    sns.violinplot(x='period', y='heart_rate', data=df, hue='period', palette="Spectral", inner="quart", legend=False)
    plt.title("各生理时段心率分布密度", fontsize=14)
    plt.ylabel("心率 (bpm)")
    plt.grid(axis='y', linestyle='--', alpha=0.5)

    # 2. 平均心率水平（柱状图）
    plt.subplot(2, 2, 2)
    avg_data = df.groupby('period', observed=False)['heart_rate'].mean()
    avg_data.plot(kind='bar', color='#4c72b0', alpha=0.8)
    plt.title("各时段平均心率水平", fontsize=14)
    plt.ylabel("均值 (bpm)")
    plt.ylim(50, 160)
    plt.xticks(rotation=0)
    for i, v in enumerate(avg_data):
        plt.text(i, v + 2, f"{v:.1f}", ha='center', fontweight='bold')

    # 3. 连续波动趋势图谱（折线/散点热力）
    plt.subplot(2, 1, 2)
    if len(df) > 5000:
        # 数据量大时使用散点热力展现分布
        plt.scatter(df['ts'], df['heart_rate'], alpha=0.2, s=2, c=df['heart_rate'], cmap='RdYlGn_r')
        plt.colorbar(label='心率强度')
    else:
        # 数据量小时使用精细折线图
        plt.plot(df['ts'], df['heart_rate'], color='#c44e52', alpha=0.6, linewidth=1)
        plt.fill_between(df['ts'], df['heart_rate'], color='#c44e52', alpha=0.1)

    plt.title(f"{label} 连续体征监测轨迹", fontsize=14)
    plt.xlabel("时间线")
    plt.ylabel("实时心率 (bpm)")
    
    plt.tight_layout(rect=[0, 0.03, 1, 0.92])
    plt.savefig(filename, dpi=300)
    plt.close()
    print(f" [完成] {label} 图谱已导出: {filename}")

def main():
    print("="*60)
    print("   生命科学：智慧医疗心率多维大数据分析系统 v2.0")
    print("="*60)
    
    all_df = fetch_all_data()
    if all_df is None or all_df.empty:
        return

    all_df['ts'] = pd.to_datetime(all_df['ts'])
    now = all_df['ts'].max() # 以数据中的最新时间为准进行回溯

    # 定义五个档位的时间过滤条件
    time_windows = [
        ("1天 (24H)", now - timedelta(days=1), "report_1_day.png"),
        ("1周 (7D)", now - timedelta(days=7), "report_1_week.png"),
        ("1月 (30D)", now - timedelta(days=30), "report_1_month.png"),
        ("1季度 (90D)", now - timedelta(days=90), "report_1_quarter.png"),
        ("1年 (365D)", now - timedelta(days=365), "report_1_year.png")
    ]

    for label, start_date, filename in time_windows:
        mask = (all_df['ts'] >= start_date) & (all_df['ts'] <= now)
        window_df = all_df.loc[mask]
        generate_visual_report(window_df, label, filename)

    print("="*60)
    print(f"   所有维度分析完成，共生成 5 张高清图谱。")
    print("="*60)

if __name__ == "__main__":
    main()

在这里插入图片描述

4.3、对于心率检测图谱的AI分析

我这里还是采用的是豆包的分析。
在这里插入图片描述

4.4、AI分析返回结果

我用md代码留在这里，分析基本符合实际人物的工作内容，我用豆包生成了一张图片，比较强的运动，那就是厨师了。
在这里插入图片描述

# 1年心率数据图谱：职业推测与健康风险分析
基于1年连续心率监测数据图谱，从时段特征、职业匹配度、健康风险三个维度展开精准分析，具体如下：

## 一、1年心率数据核心特征（分时段量化）
| 监测时段 | 心率分布区间（bpm） | 均值（bpm） | 生理特征判定 |
|----------|---------------------|-------------|--------------|
| 早晨     | 60-160              | 111.3       | 显著偏高（超出正常静息上限） |
| 午后     | 60-80               | 65.0        | 正常静息水平 |
| 晚上     | 60-180              | 122.7       | 严重偏高（远超正常静息范围） |
| 夜间     | ＜60（数据空白）| 60.0        | 接近静息下限，存在监测/生理异常可能 |

### 补充轨迹特征
全年心率波动规律稳定，无突发的长期升高/降低，但「早/晚高、午后/夜间低」的极端差值（最大差值达62.7bpm）贯穿全年，属于非生理性的节律失衡。

## 二、职业匹配度分析（基于心率节律特征）
| 职业类型                | 匹配依据                                                                 | 匹配度 |
|-------------------------|--------------------------------------------------------------------------|--------|
| 轮班制服务从业者        | 早/晚高强度工作（如夜市/酒吧服务、早班餐饮），午后短暂休息，符合心率波动规律 | 90%    |
| 自由职业者（内容创作/配送） | 夜间创作/晨间配送导致早/晚心率升高，午后自主休息，节律高度契合             | 85%    |
| 早/晚时段运动员/教练    | 固定时段高强度训练引发心率升高，非训练时段静息，符合时段特征               | 80%    |
| 常规坐班制职场人        | 心率应呈现“上午平稳、午后略升、夜间下降”，与数据特征完全不符               | 10%    |

## 三、潜在健康风险分析
| 异常指标                | 对应的健康风险                                                                 | 风险等级 | 建议行动 |
|-------------------------|--------------------------------------------------------------------------------|----------|----------|
| 早/晚心率长期＞110bpm   | 持续性窦性心动过速，增加心肌耗氧量，易诱发心肌疲劳、早搏、高血压等心血管问题     | 高       | 做心电图+心肌酶检测 |
| 夜间心率接近60bpm+数据空白 | 若为生理原因，提示窦房结功能异常（心动过缓）；若为设备原因，需优化监测方案       | 中       | 排查设备佩戴/做24小时动态心电图 |
| 心率昼夜极端波动        | 交感/副交感神经调节失衡（植物神经紊乱），可能伴随失眠、疲劳、胸闷等症状         | 中       | 做自主神经功能检测 |
| 全年高心率无缓解        | 需排除继发性疾病：甲状腺功能亢进、贫血、慢性心衰等（均会导致长期心率偏高）       | 高       | 查甲状腺功能、血常规 |

### 总结性结论
从1年心率数据看，**无明确的“确诊疾病”指征，但存在多项“病理性心率异常信号”**，属于“亚临床心血管风险”状态，需结合临床检查（而非仅靠心率数据）完成最终诊断。

## 四、核心建议（适配抗衰APP落地）
| 建议类型       | 具体措施                                                                 |
|----------------|--------------------------------------------------------------------------|
| 短期（1周内）| 1. 补充夜间心率监测（确认数据空白是设备/生理原因）；2. 记录早/晚活动场景+主观症状（胸闷/疲劳等） |
| 中期（1个月内）| 1. 完成心电图、甲状腺功能、血常规检查；2. 调整早/晚高强度活动时长，降低心率负荷 |
| 长期（3-6个月）| 1. 基于KWDB时序数据库持续追踪心率节律变化；2. 结合抗衰方案调整作息，缩小心率昼夜差值 |

### 关键点回顾
1. 1年心率核心异常是「早/晚长期高心率+昼夜极端波动」，而非偶发异常；
2. 职业指向“早/晚高强度、午后休息”的非坐班制类型，与心率节律高度匹配；
3. 无确诊疾病依据，但心血管和植物神经紊乱风险较高，需临床检查验证。

五、导出数据操作

我这里做了个数据导出操作，代码再下面留着了。
在这里插入图片描述
代码：

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
生命科学项目导向：体征监测大数据备份引擎
功能：从 KaiwuDB 提取全量心率监测数据，并生成标准的 .sql 脚本文件
"""

import psycopg2
from datetime import datetime
import time

def export_db_to_sql(output_file="full_year_heart_rate.sql"):
    """
    从数据库读取所有心率数据并导出为 SQL 插入语句
    """
    conn = None
    try:
        print(" [系统] 正在建立与 KaiwuDB 的连接...")
        conn = psycopg2.connect(
            database="health_monitor", 
            user="hongmuxiangxun", 
            password="123456", 
            host="172.29.204.142",
            port="26257"
        )
        # 1. 先使用普通游标查询总数据量
        with conn.cursor() as cur:
            print(" [数据] 正在统计数据库记录总数...")
            cur.execute("SELECT COUNT(*) FROM heart_rate;")
            total_count = cur.fetchone()[0]
            print(f" [信息] 数据库共计包含 {total_count} 条记录。")

        # 2. 使用标准批量读取（KaiwuDB 适配版）
        print(f" [导出] 正在提取数据并写入 {output_file}...")
        start_time = time.time()
        
        # 移除命名游标，使用普通游标获取数据
        cur = conn.cursor()
        # 对于 52 万数据，KaiwuDB 能够较好处理全量 SELECT，
        # 我们在这里直接执行，并通过 fetchmany 模拟流式处理，避免内存瞬间压力
        cur.execute("SELECT user_id, ts, heart_rate, device_id FROM heart_rate ORDER BY ts ASC;")

        with open(output_file, "w", encoding="utf-8") as f:
            f.write("-- 智慧医疗心率监测系统：全量体征数据备份脚本\n")
            f.write(f"-- 导出时间: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}\n")
            f.write(f"-- 记录总数: {total_count}\n\n")

            processed_count = 0
            while True:
                # 每次从数据库缓冲区拉取 10000 条，平衡内存与 IO
                rows = cur.fetchmany(10000)
                if not rows:
                    break
                
                # 分块写入 SQL 文件
                current_values = []
                for row in rows:
                    current_values.append(f"('{row[0]}', '{row[1]}', {row[2]}, '{row[3]}')")
                    
                    if len(current_values) >= 1000:
                        f.write("INSERT INTO heart_rate (user_id, ts, heart_rate, device_id)\nVALUES\n")
                        f.write(",\n".join(current_values))
                        f.write("\nON CONFLICT DO NOTHING;\n\n")
                        current_values = []
                
                # 处理当前 fetch 批次中剩余的数据
                if current_values:
                    f.write("INSERT INTO heart_rate (user_id, ts, heart_rate, device_id)\nVALUES\n")
                    f.write(",\n".join(current_values))
                    f.write("\nON CONFLICT DO NOTHING;\n\n")

                processed_count += len(rows)
                # 进度打印
                progress = (processed_count / total_count) * 100
                print(f" [进度] 已导出: {progress:.1f}% ({processed_count}/{total_count})", end='\r')

        end_time = time.time()
        print(f"\n [成功] 全量数据已成功保存至: {output_file}")
        print(f" [性能] 导出总耗时: {end_time - start_time:.2f} 秒")

        cur.close()
    except Exception as e:
        print(f"\n [错误] 导出过程中发生异常: {e}")
    finally:
        if conn:
            conn.close()

if __name__ == "__main__":
    export_db_to_sql()