Тест 3
Качайте данные тут 

Данные содержат следующие колонки: 

  • id – уникальный ID пациента; 
  • age – возраст пациента в днях;
  • gender – пол пациента (1 - женщины, 2 - мужчины); 
  • height – рост пациента в сантиметрах;
  • weight – вес пациента в  килограммах;
  • ap_hi – систолическое давление (мм. рт. столба);
  • ap_lo – диастолическое давление (мм. рт. столба);
  • cholesterol – уровень холестерина (1 – normal, 2 – above normal, 3 – well above normal);
  • gluc – уровень глюкозы (1 – normal, 2 – above normal, 3 – well above normal);
  • smoke – курит ли пациент (0 – нет, 1 – да);
  • alco – пьет ли пациент (0 – нет, 1 – да);
  • active – ведет активный образ жизни (0 – нет, 1 – да);
  • cardio – есть ли сердечно-сосудистые заболевания (0 – нет, 1 – да).
Далее в заданиях работать нужно будет с ними
电子邮件 *
ФИО *
Загрузите предложенные данные. Сколько человек каждого пола присутствует в выборке? Выберите нужную пару чисел, где первым идет число женщин, а вторым – число мужчин:
*
1 分

Создайте новую колонку в ваших данных – BMI (body mass index, индекс массы тела). Для этого разделите вес в килограммах на квадрат роста в метрах. 

Затем вычислите среднее значение данного признака. В ответ запишите значение округленное до сотых. В качестве десятичного разделителя используйте точку.

*
1 分
График
Выберите вариант кода, чтобы получить график, показанный выше (считайте, что модуль seaborn уже импортирован):
*
1 分
Создайте новый датафрейм, который будет состоять из пациентов, у которых диастолическое давление ниже систолического. Какой процент от общего количества пациентов они составляют? Ответ округлите до сотых, в качестве десятичного разделителя используйте точку.
*
1 分

Отфильтруйте из переменной ap_hi в исходном датафрейме все выбросы (за выброс считаем значение больше 220). 

Какое количество наблюдений в этих данных является выбросами?

1 分

Разбейте всех людей в исходном датафрейме на следующие возрастные группы (считаем, что количество дней в году 365, високосные года не учитываем): 

моложе 40  
от 40 - 50 (не включая)
50 - 60 (не включая)
60 +

Визуализируйте распределение уровня холестерина для различных возрастных категорий (с разграничениями по созданными вами возрастным группам). В какой группе больше всего людей с уровнем холестерина 3?

*
1 分
提交
清除表单内容
切勿通过 Google 表单提交密码。
此内容不是由 Google 所创建,Google 不对其作任何担保。 举报滥用行为 - 服务条款 - 隐私权政策