Does going to university in a different country affect your mental health? A Japanese international university surveyed its students in 2018 and published a study the following year that was approved by several ethical and regulatory boards.
The study found that international students have a higher risk of mental health difficulties than the general population, and that social connectedness (belonging to a social group) and acculturative stress (stress associated with joining a new culture) are predictive of depression.
Explore the students
data using PostgreSQL to find out if you would come to a similar conclusion for international students and see if the length of stay is a contributing factor.
Here is a data description of the columns you may find helpful.
¿Asistir a una universidad en un país extranjero puede afectar el bienestar mental? En 2018, una universidad japonesa con un cuerpo estudiantil diverso realizó una encuesta exhaustiva. El año siguiente se publicó un estudio aprobado ética y reglamentariamente basado en esta investigación.
Los hallazgos del estudio revelaron que los estudiantes de diferentes países son más susceptibles a problemas de salud mental que la población general. Específicamente, se identificaron factores predictivos para experimentar síntomas depresivos como el sentido de pertenencia social del estudiante dentro de un grupo y el estrés relacionado con la adaptación a un nuevo entorno cultural.
Para profundizar en este asunto se llevó a cabo la exploración de los datos de los estudiantes utilizando PostgreSQL. El objetivo era comprobar si se puede sacar una conclusión comparable respecto de los estudiantes internacionales y si la duración de su estancia influye en estas observaciones.
A continuación, encontrará una descripción de las columnas del conjunto de datos que podrían resultar útiles en esta investigación.
Field Name | Description |
---|---|
inter_dom | Types of students (international or domestic) |
japanese_cate | Japanese language proficiency |
english_cate | English language proficiency |
academic | Current academic level (undergraduate or graduate) |
age | Current age of student |
stay | Current length of stay in years |
todep | Total score of depression (PHQ-9 test) |
tosc | Total score of social connectedness (SCS test) |
toas | Total score of acculturative stress (ASISS test) |
import pandas as pd
students = pd.read_csv('students.csv')
students
import matplotlib.pyplot as plt
Explore y comprenda los datos:
En la fase inicial de este proyecto, profundizaremos en nuestro conjunto de datos para obtener una comprensión más profunda del mismo. Nuestras intenciones incluyen realizar un recuento completo de todas las entradas de datos para determinar el número total de registros. Además, agruparemos los registros para diferenciar entre estudiantes nacionales e internacionales y analizaremos sus respectivas cantidades.
-- Count the number of records in the datasets
SELECT COUNT(*) AS total_records
FROM students;
-- How many international and domestic students are in the dataset?
SELECT inter_dom, COUNT(inter_dom) AS count_inter_dom
FROM students
GROUP BY inter_dom;
Filtrar para comprender los datos de cada tipo de estudiante:
Examine los datos de cada tipo de estudiante dentro de la columna 'inter_dom' ejecutando dos consultas. Estas consultas filtrarán los datos para los dos tipos distintos de estudiantes especificados en la tabla y los estudiantes cuyo estado es desconocido (NULL).
-- Query the data to see all records where inter_dom is neither "Dom" or "Inter" including null values
SELECT *
FROM students
WHERE inter_dom NOT LIKE 'D%'
AND inter_dom NOT LIKE 'I%'
OR inter_dom IS NULL;
-- Where are the international students from?
SELECT region, COUNT(inter_dom) AS count_inter_dom
FROM students
WHERE inter_dom = 'Inter'
GROUP BY region;
Consultar las estadísticas resumidas de las puntuaciones de diagnóstico de todos los estudiantes:
Recupere las estadísticas resumidas de cada prueba de diagnóstico utilizando funciones agregadas. Redondea los valores promedio a dos decimales y aplica alias como min_phq, max_phq y avg_phq. Repita esta estructura para todas las pruebas, incluidas _scs y _as .
Las funciones agregadas, como MIN() , proporcionan información útil.
Para mejorar la legibilidad, puede crear alias empleando el comando AS dentro de la instrucción SELECT .
Para lograr la precisión deseada, utilice la función ROUND() para redondear los valores numéricos en los campos de puntuación a dos decimales.
-- Find out the basic summary statistics of the diagnostic for all students
SELECT
MIN(todep) AS min_phq,
MIN(tosc) AS min_scs,
MIN(toas) AS min_as,
MAX(todep) AS max_phq,
MAX(tosc) AS max_scs,
MAX(toas) AS max_as,
ROUND(AVG(todep), 2) AS avg_phq,
ROUND(AVG(tosc), 2) AS avg_scs,
ROUND(AVG(toas), 2) AS avg_as,
FROM students;
Resumir los datos de los estudiantes internacionales:
Además, limite los resultados para centrarse exclusivamente en las estadísticas resumidas de los estudiantes internacionales. Logre esto filtrando y agrupando.
Para resumir para el grupo específico, utilice una cláusula WHERE para filtrar estudiantes internacionales. Incluya el campo por el que está agrupando dentro de la instrucción SELECT .