本公开公开了疾病就诊数据的预处理方法、系统、设备及介质,包括:从医院服务器获取患者就诊记录;对获取的患者就诊记录进行数据清洗;对数据单位不统一的数据,转换到同一个数据单位;将名称不同但是含义相同的数据名称,转换到同一个数据名称;将汉字进行数值化处理;采用最大最小值归一化处理算法,对数据进行归一化处理;对患者就诊记录所对应的医院地理位置进行处理,得到预处理后的疾病就诊数据。计算机处理数据时,对分类型数据不敏感甚至出错,通过科学性的方法把具有多种分类型数据维度的医疗数据转化为机器可处理的数据,对后续数据挖掘出有价值信息具有重要意义。