NOTA 10 - Atividade 2 (A2) - ESTATISTICA APLICADA AO DATA SCIENCE - EAD FMU
May 17, 2023 | Author: Anonymous | Category: N/A
Short Description
Download NOTA 10 - Atividade 2 (A2) - ESTATISTICA APLICADA AO DATA SCIENCE - EAD FMU...
Description
PERGUNTA PERG UNTA 1 1. O ser hum humano ano tem eno enorme rme facilidade e em m agrupar, po porr similaridade, e classificar coisas, todos os tipos de coisas. Por conta disso, problemas de classificação são muito frequentes no mundo, mais frequentes que problemas de regressão. Fornecemos alguns exemplos de aplicação de métodos de classificação no mundo dos negócios. Dentre esses exemplos, encontramos: 1. a Netflix usa class classificadores ificadores para recomendar filmes. Para a Netflix, o valor desse tipo de aplicação é que, quanto mais filmes assistirmos, maior será a sua receita; 2. o Facebook usa classif classificadores icadores para rec recomendar omendar novas amizades para a nossa rede de relacionamento. Para o Facebook, o valor desse tipo de aplicação é que, quanto maior nossa rede de relacionamento, maior será a sua receita; 3. um banco de varejo usa classificad classificadores ores para d detectar etectar se u uma ma operação com cartão de débito ou crédito é ou não uma operação fraudulenta. Para o banco, o valor dessa aplicação é que, quanto antes operações fraudulentas forem detectadas, mais rapidamente o banco pode agir para impedir perdas para seus clientes e para ele próprio; 4. uma conc concessionária essionária d de e distribuição de energ energia ia elétrica usa classificadores para identificar casos potenciais de roubo de energia da rede, os famosos “gatos”. Para as concessionárias de distribuição de energia elétrica, o valor dessa aplicação é evitar prejuízo com o furto de energia da rede, além do relevante aspecto de prevenção de acidentes decorrentes de instalações clandestinas.
Está correto o que se afirma em:
I, II, III e IV. I e III, apenas.
III e IV, apenas. I e II, apenas. II e IV, apenas. 1 pontos
PERGUNTA PERG UNTA 2 1. Entre as técnicas d das as quais lanço lançou u mão para av visualização isualização dos dados da amostra, uma jovem cientista de dados usou gráficos de dispersão.
Como cientista de dados, ela sabia exatamente em que situações empregar gráficos de dispersão. E você, será que você também já sabe? Analise as afirmativas a seguir e assinale assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
1. podem ( ) Gráficos de dispersão, inglês c chamados hamados de scatter plots,a s só ó ser usados para a em visualização de uma única variável, qual deve ser obrigatoriamente uma variável qualitativa. 2. ( ) Gráficos de dispersão são usado usados s para a visualização da relação entre duas variáveis quantitativas, em que os dados das duas variáveis são plotados aos pares. Permite, dessa forma, a verificação visual, pelo estatístico ou pelo cientista de dados, se há uma tendência de uma variável aumentar quando a outra aumenta, diminuir quando a outra diminui, ou se não há uma relação aparente entre as duas. 3. ( ) Um gráfico de dispersão foi usado para exibir, em pares, a relação entre o valor do imóvel e a sua área. Esse tipo de gráfico é chamado, em inglês, de scatter plot. 4. ( ) Um gráfico de dispersão foi usado para exibir, em pares, a relação entre o valor do imóvel e o seu andar. Esse tipo de gráfico é chamado, em inglês, de scatter plot.
Assinale a alternativa que apresenta apresenta a sequência correta.
V, V, F, F. F, F, V, V.
F, V, V, V. F, V, F, V. V, V, F, V. 1 pontos
PERGUNTA PERG UNTA 3 1. Vimos que há dois prin principais cipais tipos de aprendiz aprendizagem agem supervision supervisionada: ada: problema de regressão e problema de classificação. São os tipos de variáveis resposta dos dados em análise que distinguem esses dois tipos entre si. Relativamente a esses dois tipos, analise as afirmativas a seguir.
1. Na aprendizag aprendizagem em supervisio supervisionada, nada, um proble problema ma de regressão regressão é um no qual a variável resposta é qualitativa. 2. Na aprendiza aprendizagem gem supervisio supervisionada, nada, um problema problema de regressão regressão é um no qual a variável resposta é quantitativa. 3. Na aprendiz aprendizagem agem sup supervisionada, ervisionada, u um m problema de classificaç classificação ão é um no qual a variável resposta é qualitativa. 4. Na aprendiz aprendizagem agem sup supervisionada, ervisionada, u um m problema de classific classificação ação é um no qual a variável resposta é quantitativa.
Está correto o que se afirma em: II e III, apenas. III, apenas. III e IV, apenas. II e IV, apenas. I e III, apenas. 1 pontos
PERGUNTA PERG UNTA 4 1. Tarefas de classificaç classificação ão são muitos c comuns omuns na estatística e na ciência dos dados, por serem muito comuns em todas atividades humanas, na ciência, na vida social ou nos negócios. Especificamente, discutimos aplicações de modelos preditivos de classificação baseados em modelos de regressão logística simples ou múltipla. Com isso em mente, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 1. Regressão logís logística tica pode s ser er empregada na predição do peso médio (massa corporal média) de uma pessoa em função de sua altura, idade e sexo. 2. Regressão logís logística tica pode s ser er empregada na predição do consumo médio de combustível de um carro em função da potência do seu motor e do seu peso. 3. Regressão logís logística tica pode s ser er empregada na predição da probabilidade de uma pessoa votar em um determinado candidato e não nos outros em função de sua escolaridade, idade, sexo e classe social. 4. Regressão logís logística tica pode s ser er empregada na predição da probabilidade de a pessoa ser diabética em função de um conjunto de sintomas clínicos que apresenta.
Assinale a alternativa que apresenta apresenta a sequência correta.
V, V, F, F. F, F, F, F. V, V, V, V. F, V, F, V. F, F, V, V. 1 pontos
PERGUNTA PERG UNTA 5 1. O modelo de regressão lo logística gística simples desenvolvido por uma jov jovem em cientista de dados para a predição da probabilidade de inadimplência com o cartão de crédito foi:
Tomando como base esse modelo, que foi ajustado aos dados da amostra cedida pelo gerente, podemos estimar o valor esperado para a probabilidade de inadimplência com cartão de crédito das pessoas. Por exemplo, vamos consid considerar erar duas pesso pessoas, as, uma com um g gasto asto de médio mensal com o cartão de R$ 500,00, e a outra com um gasto médio mensal de R$ 1.000,00. Usando o modelo ajustado anterior, obtemos, respectivamente (assinale a alternativa correta):
7% e 37% . 17% e 27%. 7% e 27%.
27% e 7%. 37% e 17%. 1 pontos
PERGUNTA PERG UNTA 6 1. A amostra rela relativa tiva aos dad dados os de ina inadimplência dimplência com cartões tinha 200 observações de 4 variáveis: a renda mensal da pessoa (R$), seu gasto médio com cartão de crédito (R$), se a pessoa tinha um emprego estável (Sim ou Não) e se a pessoa havia, ao longo do período pesquisado, ficado inadimplente com o pagamento de faturas do cartão ao menos uma vez (Sim ou Não). Reflita sobre esse caso, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
1. ( ) Todos os dados fornecidos pelo gere gerente nte do banco à jovem cientista de dados são dados relativos a variáveis quantitativas. 2. ( ) T Todos odos os dados fornecidos pelo gerente do banco à jovem cientista de dados são dados relativos a variáveis qualitativas. 3. ( ) Dentre os dados fornecidos pelo gerente do banco à jovem cientista de dados, dois são relativos a uma variável quantitativa e dois são relativos a variáveis qualitativas. 4. ( ) Dentre os dados fornecidos pelo gerente do banco à jovem cientista de dados, um é relativo a uma variável quantitativa e os outros são relativos a variáveis qualitativas.
Assinale a alternativa que apresenta apresenta a sequência correta.
F, V, V, V. V, V, F, F. V, V, F, V. F, V, F, V. F, F, V, F.
1 pontos
PERGUNTA PERG UNTA 7 1. Continuando co com m o mesmo caso da questão ante anterior, rior, relativa à aprovação, pelos bancos, de crédito na forma de cartão de crédito, como se fazia, no passado, a aprovação da concessão de cartões de crédito pelos bancos? E, hoje em dia, como os bancos fazem essa aprovação? Reflita sobre essas perguntas e suas respostas, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
1. ( ) No passado, os bancos fazia faziam, m, e ainda fazem, ao menos em parte, a aprovação da concessão de cartões de crédito através da definição de regras que devem ser atendidas por cada cliente, tais como idade, emprego estável, renda fixa, fi xa, dívidas pequenas, nome limpo e casa própria. 2. ( ) Hoje e em m dia, dentre outras alternativas, uma que é frequentemente usada pelos bancos são algoritmos de aprendizagem supervisionada supervisionada que classificam se o cliente é um potencial bom ou mau pagador.
3. ( ) Para us usarmos armos algoritmos de classificaçã classificação o com es esse se propósito de aprovar ou não cartões de crédito, precisamos de dados. Ensinamos ao algoritmo, com base nos dados que lhe são passados, a predizer clientes que são maus pagadores potenciais das faturas do cartão. Dessa forma, se o algoritmo, ao ser alimentado com os dados referentes a um novo c cliente, liente, classificar esse cliente como um mau pagador potencial, o banco não aprovará o cartão. 4. ( ) Para e equipes quipes de análise de crédito, poder contar com a ajuda de um software com a capacidade de recomendar a aprovação ou não da concessão do cartão é de grande valor. 5. ( ) A reco recomendação mendação feita pelo software poderá ser tratad tratada a ao lado de outras regras de crédito para uma decisão final sobre a concessão de cartão para o cliente.
Assinale a alternativa que apresenta apresenta a sequência correta.
F, F, F, F. V, V, F, F. V, V, F, V. V, V, V, V.
F, V, F, V. 1 pontos
PERGUNTA PERG UNTA 8 1. Os dados cedid cedidos os pelo gerente do banco es estavam tavam bem organiza organizados dos e livres de erros. A nossa jovem cientista de dados não precisou, portanto, fazer uma limpeza e pré-tratamento dos dados e pode prosseguir imediatamente para uma análise descritiva deles antes do desenvolvimento do modelo. Tendo isso em vista, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). 1. ( ) Chamam Chamamos os de anális análise e descritiva dos dados seus sumários (ou resumos) estatísticos dos mesmos e a sua visualização. Ambos, os sumários e as visualizações visualizações,, nos ajudam a entender o comportamento dos dados e, através deles, do fenômeno ou processo estudado. 2. ( ) São q quatro uatro as v variáveis ariáveis estudad estudadas as pela ci cientista entista de da dados: dos: renda mensal da pessoa, seus gastos médios com o cartão, se a pessoa tinha ou não um emprego estável ao longo do período amostrado e se ficou ou não inadimplente ao longo do deste período.
3. ( ) Para c criar riar sumários estatísticos das variáveis quan quantitativas, titativas, a renda mensal da pessoa e seus gastos com o cartão, a cientista de dados usou as funções min(), mean() e max() do software estatístico R para calcular os valores mínimo, médio e máximo dos dados observados para essas variáveis. 4. ( ) Para c criar riar sumários estatísticos das variáveis qualitativas qualitativas,, se a pessoa tinha ou não um emprego estável e se tinha ou não ficado inadimplente com o pagamento das faturas doacartão aotable() longodo do período amostrado, a cientista de dados usou função software estatístico R para calcular a frequência com que os níveis de cada uma dessas variáveis se manifestaram na amostra estudada.
Assinale a alternativa que apresenta apresenta a sequência correta.
V, F, F, V. F, F, V, V.
F, V, V, F. V, V, V, V. V, V, F, F. 1 pontos
PERGUNTA PERG UNTA 9 1. Vimos que uma jjovem ovem cientista de dados realizou o treino (ajuste) de um modelo de regressão logística múltipla aos dados da amostra. Os resultados que encontrou foram muito ricos, sugerindo uma série de explicações, aprendidas pelo algoritmo com base nos dados fornecidos. Veja que dizemos sugeridas”, pois qualquer resultado um algoritmo deve“explicações ser confrontado com especialistas da área em de estudo. Contudo, vamos rever o que o modelo de regressão múltipla treinado pela jovem cientista de dados sugere. Para isso, analise as afirmativas a seguir. 1. A probabilidade da inadimplência cresce com o aumento dos gastos médios com o cartão de crédito. Isto, que nos parece óbvio, foi o que os dados “contaram” para o algoritmo de regressão logística múltipla. 2. A probabilidade da inadimplência cresce com o aumento da renda média mensal das pessoas. Isto não é tão óbvio e provavelmente não teríamos coragem de generalizar para outras situações, mas foi o que os dados da amostra do gerente do banco “contaram” para o algoritmo de regressão logística múltipla.
3. Para duas pess pessoas oas com a me mesma sma renda mensal e o mesmo gas gasto to mensal com cartão de crédito, a probabilidade de inadimplência com o cartão é maior para aquela sem emprego estável. Novamente, isto foi o que os dados amostrados “contaram” para o algoritmo de regressão logística múltipla. 4. O modelo de regressão logís logística tica múltipla, ajustado ajustado aos dados dados da amostra, consegue predizer os efeitos da renda mensal da pessoa, donão seu um gasto médio estável, mensal com cartão de crédito ela tem ou emprego na probabilidade de a e se pessoa ficar inadimplente com o cartão de crédito. Um algoritmo desse tipo pode ajudar no processo decisório de um banco quanto à aprovação de cartão de crédito, ao lado de outros critérios e ferramentas analíticas disponíveis para o banco.
Está correto o que se afirma em:
III e IV, apenas. I e II, apenas. II e III, apenas. I, II, III e IV.
II, III e IV, apenas. 1 pontos
PERGUNTA PERG UNTA 10 1. A estatística des descritiva critiva usa de de métodos numéricos para resumir dado dados, s, também chamados de sumários estatísticos, e de gráficos para a visualização dos dados. A jovem cientista de dados usou algumas técnicas de visualização de dados para analisar sua amostra, mas deixou outras de lado. Analise as afirmativas a seguir e veja veja quais estão coerentes com sua sua análise descritiva dos dados. 1. Na sua a análise nálise descritiva dos dados da amostra, a jovem cie cientista ntista de dados usou histogramas para a visualização dos dados quantitativos das amostras, que são a renda r enda mensal das pessoas e seus gastos médios com o cartão de crédito. 2. Na sua a análise nálise descritiva dos dados da amostra, a jovem cie cientista ntista de dados usou diagramas de barras para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito.
3. Histogramas e diagramas de barras são fformas ormas tradicionais de visualização gráfica de dados quantitativos e qualitativos, respectivamente, na estatística e na ciência dos dados. 4. A jovem cien cientista tista de d dados ados usou, para este c caso, aso, apenas histogramas, e preferiu apenas lançar mão da funçãocom table() software estatístico R, para determinar a frequência quedo os níveis das variáveis qualitativas se manifestaram na amostra estudada, sem fazer uso de diagramas de barras, o que poderia ter feito, se quisesse.
Está correto o que se afirma em:
II e III, apenas. I e II, apenas. I, III e IV apenas. I e IV, apenas.
IV, apenas.
View more...
Comments