Skip to content
New Workbook
Sign up
Competition - Employee Network Analysis
0

Como a empresa pode melhorar a coloboração entre as equipes?

📖 Contexto

Você trabalha no setor de analytics de uma empresa multinacional, e o chefe do RH solicitou a sua ajuda para mapear a rede de comunicação entre os empregados da empresa, usando dados de mensagens

Eles planejam usar a rede de comunicação dos empregados para entender melhor a forma como a empresa compartilha suas informações internamente. O objetivo principal é achar maneiras de melhorar a comunicação dentro da empresa

💾 Os dados

A empresa tem dados relativos a seis meses da comunicação entre os empregados, para serem analisados. Por motivos de privacidade, apenas foi disponibilizado quem enviou a mensagem, para quem, e o tamanho da mensagem (source).

"Mensagens" tem as informações de quem enviou, quem recebeu e o horario;

  • "sender" - id do empregado que enviou a mensagem.
  • "receiver" - id do empregado que recebeu a mensagem.
  • "timestamp" - a data e hora da mensagem no modelo.
  • "message_lenght" - o número de palavras na mensagem.

"Empregados" tem informações de cada empregado;

  • "id" - id do empregado.
  • "department" - o departamento do empregado dentro da empresa.
  • "location" - o pais onde o empregado mora.
  • "age" - a idade do empregado.

Acknowledgments: Pietro Panzarasa, Tore Opsahl, and Kathleen M. Carley. "Patterns and dynamics of users' behavior and interaction: Network analysis of an online community." Journal of the American Society for Information Science and Technology 60.5 (2009): 911-932.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import timedelta
mensagens = pd.read_csv('data/messages.csv', parse_dates= ['timestamp'])
empregados = pd.read_csv('data/employees.csv')

Principais Descobertas

  • Os departamentos que mais mandam mensagens são Vendas, Operações e Administração
  • O empregado com mais conexões é o emprego com id 598 do departamento de Operações. E o com menos e o do id 605 do departamento da Administração
  • O empregado mais influente é o de id 605 da administração

Análise

Antes de começar a analisar os dados, primeiro é necessário verificar se não existem inconsistências nos dados

# verificando se existem incosistencias os dados em faltando
empregados.info()
mensagens.info()

Não existem dados nulos em nenhum dos dois conjuntos de dados

empregados.describe()
empregados.department.value_counts()
empregados.location.value_counts()
mensagens.describe()