借助互/物联网、云计算、深度学习等大数据技术,遵循生命历程流行病学和系统流行病学原理,从山东省141个区/县(总人口1亿人)随机抽取了山东22个县17个城市共500万人(设计规模为1000万人),以身份证为唯一索引,融合居民健康档案、基本公共卫生、电子病历、健康/疾病/死因监测、医保数据等136个数据库的近8年来的数据信息(10000余个变量),进而基于加速追踪设计和大数据映射模型,而创建的全人群全生命历程健康医疗大数据队列。旨在实时动态创建全人群全生命历程健康图谱(危险暴露图谱、疾病图谱、死亡图谱、疾病负担图谱、健康维护图谱和健康保障图谱),并探索影响这些图谱的因素及控制对策。

  • 队列总体基本信息
    • 基本信息
      项目名称 山东全人群全生命历程健康医疗大数据队列
      项目编号 CCC20180523001
      相关信息网址 http://biostat.sdu.edu.cn/
      项目负责人
      薛付忠
      项目牵头单位 山东大学,山东省卫生健康委员会,浪潮集团
      联系人及联系方式
      季晓康
      项目资助来源 山东省卫生计生委重大专项
      主要研究目的 借助互/物联网、云计算、深度学习等大数据技术,遵循生命历程流行病学和系统流行病学原理,从山东省141个区/县(总人口1亿人)随机抽取了山东22个县17个城市共500万人(设计规模为1000万人),以身份证为唯一索引,融合居民健康档案、基本公共卫生、电子病历、健康/疾病/死因监测、医保数据等136个数据库的近8年来的数据信息(10000余个变量),进而基于加速追踪设计和大数据映射模型,而创建的全人群全生命历程健康医疗大数据队列。旨在实时动态创建全人群全生命历程健康图谱(危险暴露图谱、疾病图谱、死亡图谱、疾病负担图谱、健康维护图谱和健康保障图谱),并探索影响这些图谱的因素及控制对策。
      项目开始日期 采取回顾性与前瞻性纵向队列设计相结合的方法,采集了自2010年至今的上述信息
      项目结束日期(或预计结束日期) 队列基于山东省卫生与健康浪潮云平台,采用山东大学研制的健康医疗大数据云技术平台,实时向前追踪和信息化随访。
    • 研究对象抽样信息
      研究对象人数 500万人
      研究对象年龄范围 全年龄组
      地区分布 山东省
      抽样方法 多阶段抽样的方法 农村队列:第一阶段:在全省17市共141个县中分层随机抽取22个县;第二阶段:在所抽取的22个县中采用按容量比例概率抽样(PPS法)每个县随机抽取3-5个乡镇;第三阶段:在被抽中的乡镇中采取整群抽样方法,随机抽取常住人口在1000人以上的行政村(居民委员会)共100-150个行政村作为被抽中的基本农村社区单位,作为三级抽样单位。 城市队列:第一阶段:在山东省17市政府所在的每个城市分别随机抽取1-3区,共抽中20个区,作为一级抽样单位;第二阶段:采用单纯随机抽样方法在每个区中随机抽取5-10个社区(街道办)作为二级抽样单位;第三阶段:被抽中社区的全部居民,按照全员人口信息库和居民健康档案中的身份证信息,全部纳入队列,构成城市社区全人群队列。
      纳入标准 山东省户籍人口(身份证为唯一索引)
      排除标准 非山东省户籍人口
    • 其他相关信息
      关键成果 创建了山东全人群全生命历程健康图谱(包括危险暴露图谱、发病图谱、死亡图谱、疾病负担图谱、健康维护图谱、健康保障图谱),并实时展示其动态变化特征,对于指导山东省卫生规划、政策制定、医学研究和健康产业布局具有可持续的战略意义。
      相关文章列表 暂无
      主要优势 采用了先进的大数据设计理念,具有其鲜明的特色:1)样本量大、代表性良好;2)设计理念先进,具有可持续长期追踪发展远景;3)数据信息丰富,规模宏大;4)数据整合云技术平台先进、高效;5)数据共享机制合理、可行。
      主要局限 仅代表山东省全人群,不能代表全国人群。