基因样本信息库

GCBI基因样本信息库聚焦医院、科研院所等单位或组织,提供临床和分子数据的标化,及临床和分子数据的存储、管理和数据挖掘能力,实现临床和分子的大数据挖掘系统。

 

系统亮点

  • 临床数据、分子数据等分子医学数据进行本体化标化,便于跨数据集和跨项目数据分析。
  • 内置20余种挖掘算法,供用户进行基因临床大数据分析与挖掘,也能够根据需求提供个性化算法定制。

 

分子医学数据本体化

——标化自有和公共数据,构建特色基因信息数据库

科学研究或临床检测项目得到的数据往往存在描述方式不一,结构化不明确等缺点,为解决这一问题便于数据储存与挖掘,我们通过本体数据库对这些数据进行标化和存储。

  • 本体数据库:使用了很多生物医学本体数据库,如:HPO, MeSH, SNOMED CT, ICD-10等。
  • 样本数据存储和管理:基因样本信息库通过树状结构对分子和医学信息进行结构化存储,树状结构具有数据存储冗余度小、直观性强、检索过程简单高效、节点增删改查操作高效等特点。

 

 

基因临床大数据分析与挖掘

——临床与基因数据联合分析,持续产出科研成果

基因样本信息库提供丰富内嵌分析流程,分析各类临床信息与分子数据关系,帮助发现原创、权威的临床基因研究成果。

  • 可视化分析工具:提供多套可视化分析工具,可以直接从树状结构拖拽进入可视化分析流程进行大数据挖掘。例如:Survival Analysis, ANOVA, Heatmap, Hierarchical Clustering , Correlation Analysis, IC50, PCA, Logistic Regression等。
  • SmartR:引入了基于R语言的外部生物信息算法支持,帮助用户完成更多个性化的挖掘工作,同时减轻语言编程与数据导入的工作量。
  • 基因组浏览器:内嵌的基因组浏览器可以在基因组上展示用户需要查看的数据峰值、位点突变信息、基因信息等。也可以通过添加track文件来丰富基因组浏览器上的内容。

 

 

典型案例

  • 复旦大学附属中山医院
  • 上海产业技术研究院

 

相关文章
留下回复