Iniciando um ambiente de ciência de dados com Anaconda

Iniciando um ambiente de ciência de dados com Anaconda

O Anaconda é um gerenciador de pacotes e ambientes Python, mas atualmente é bem conhecido no meio de BigData e DataScience, em parceria com o Hederson Boechat, vamos iniciar um novo blog: Responsus, que tem como objetivo mostrar como podemos fazer o nosso controle financeiro utilizando as ferramentas de Ciência de Dados.

Nesse post vou mostrar como fazemos a instalação do Anaconda e abrimos o Jupyter Notebook para começar as nossas análises.

Primeiro passo é fazer o download do instalador:

wget https://repo.anaconda.com/archive/Anaconda3-5.2.0-Linux-x86_64.sh

Agora damos permissão de execução e executamos o script:

$ chmod +x Anaconda3-5.2.0-Linux-x86_64.sh 
$ ./Anaconda3-5.2.0-Linux-x86_64.sh 

Ao executar o script de instalação será exibida a mensagem abaixo:

Welcome to Anaconda3 5.2.0

In order to continue the installation process, please review the license
agreement.
Please, press ENTER to continue
>>> 
===================================
Anaconda End User License Agreement
===================================

Copyright 2015, Anaconda, Inc.

All rights reserved under the 3-clause BSD License:

Redistribution and use in source and binary forms, with or without modification,
 are permitted provided that the following conditions are met:

Vamos aceitar a licença para prosseguir com a instalação:

Do you accept the license terms? [yes|no]
[no] >>> yes

Agora basicamente é só pressionar ENTER para todas as perguntas a seguir, para fazer a instalação no diretório padrão:

Anaconda3 will now be installed into this location:
/home/alisson/anaconda3

  - Press ENTER to confirm the location
  - Press CTRL-C to abort the installation
  - Or specify a different location below

[/home/alisson/anaconda3] >>> 
PREFIX=/home/alisson/anaconda3

Como a Anaconda tem parceria com a Microsoft, eles recomendam instalar o VSCode para escrever os seus códigos, mas isso é opcional, no meu caso já estava instalado:

===========================================================================

Anaconda is partnered with Microsoft! Microsoft VSCode is a streamlined
code editor with support for development operations like debugging, task
running and version control.

To install Visual Studio Code, you will need:
  - Administrator Privileges
  - Internet connectivity

Visual Studio Code License: https://code.visualstudio.com/license

Do you wish to proceed with the installation of Microsoft VSCode? [yes|no]
>>> yes
Proceeding with installation of Microsoft VSCode
VSCode is already installed!

Agora que tudo já está instalado, vou abrir um novo terminal e criar uma pasta onde vou armazenar os projetos:

$ mkdir blog_responsus/

E iniciar o jupyter notebook:

alisson@alisson-avell:~/blog_responsus$ jupyter notebook pa

A saída do comando será parecida com essa:

[I 10:56:24.754 NotebookApp] JupyterLab beta preview extension loaded from /home/alisson/anaconda3/lib/python3.6/site-packages/jupyterlab
[I 10:56:24.754 NotebookApp] JupyterLab application directory is /home/alisson/anaconda3/share/jupyter/lab
[I 10:56:24.758 NotebookApp] Serving notebooks from local directory: /home/alisson/blog_responsus
[I 10:56:24.758 NotebookApp] 0 active kernels
[I 10:56:24.758 NotebookApp] The Jupyter Notebook is running at:
[I 10:56:24.758 NotebookApp] http://localhost:8888/?token=a72394b9a1a0fe8b27278e5855c03113c78003eb3bb4b6c7
[I 10:56:24.758 NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation).
[C 10:56:24.759 NotebookApp] 
    
    Copy/paste this URL into your browser when you connect for the first time,
    to login with a token:
        http://localhost:8888/?token=a72394b9a1a0fe8b27278e5855c03113c78003eb3bb4b6c7&token=a72394b9a1a0fe8b27278e5855c03113c78003eb3bb4b6c7

Note que no final tem a url de acesso que pode ser feita em qualquer navegador, desde que copiado o token junto.

Será aberta uma página similar a essa:

Agora vamos criar um primeiro script python, seguindo os passos da imagem abaixo:

E na página a seguir vamos colocar o nosso primeiro código Python:

Valeu!

CURSOSCONSULTORIA    CONTATO

Anterior IBM compra a RedHat por US$34 bilhões e o que isso muda na vida do SysAdmin?
Próxima Moodle: agendando tarefas através de plugins

About author

Alisson Machado
Alisson Machado 16 posts

Alisson Menezes, atua como Gerente de T.I, 9 anos de experiência em projetos FOSS (Free and Open Source Software) e Python. Formação em Análise de Sistemas pela FMU e cursando MBA em BigData pela FIA, possui certificações LPI1, LPI2 e SUSE CLA, LPI DevOps e Exim - DevOps Professional. Autor dos cursos Python Fundamentals, Python for Sysadmins, MongoDB for Developers/DBAs, DevSecOps, Co-Autor do Infraestrutura Ágil e Docker da 4Linux e palestrantes em eventos como FISL, TDC e Python Brasil. É entusiasta das mais diversas áreas em T.I como Segurança, Bancos de dados NoSQL, DataScience mas tem como foco DevOps e Automação.

View all posts by this author →

Você pode gostar também

Big Data

Engenheiro de Dados: nova oportunidade em TI

Profissões tendem a desaparecer e surgir com outras roupagens em um mundo onde a quantidade de conhecimento cresce exponencialmente. Embora esse fenômeno cause crises em algumas áreas, ele pode ser

Infraestrutura

Instalação do Cuda 9 em distribuições Linux baseadas no Ubuntu

Se você deseja trabalhar com algoritmos de Machine Learning, provavelmente precisará usar processamento paralelo para acelerar os resultados dos seus algoritmos. Muitos frameworks como por exemplo, o TensorFlow, já possuem

Big Data

JSON e BSON no MongoDB: para iniciantes

Dando continuidade na série de MongoDB, nesse post farei uma Introdução ao formato “Javascript Object Notation” (JSON), ao BSON e aos primeiros passos com o MongoDB.