Iniciando um ambiente de ciência de dados com Anaconda

Iniciando um ambiente de ciência de dados com Anaconda

O Anaconda é um gerenciador de pacotes e ambientes Python, mas atualmente é bem conhecido no meio de BigData e DataScience, em parceria com o Hederson Boechat, vamos iniciar um novo blog: Responsus, que tem como objetivo mostrar como podemos fazer o nosso controle financeiro utilizando as ferramentas de Ciência de Dados.

Nesse post vou mostrar como fazemos a instalação do Anaconda e abrimos o Jupyter Notebook para começar as nossas análises.

Primeiro passo é fazer o download do instalador:

wget https://repo.anaconda.com/archive/Anaconda3-5.2.0-Linux-x86_64.sh

Agora damos permissão de execução e executamos o script:

$ chmod +x Anaconda3-5.2.0-Linux-x86_64.sh 
$ ./Anaconda3-5.2.0-Linux-x86_64.sh 

Ao executar o script de instalação será exibida a mensagem abaixo:

Welcome to Anaconda3 5.2.0

In order to continue the installation process, please review the license
agreement.
Please, press ENTER to continue
>>> 
===================================
Anaconda End User License Agreement
===================================

Copyright 2015, Anaconda, Inc.

All rights reserved under the 3-clause BSD License:

Redistribution and use in source and binary forms, with or without modification,
 are permitted provided that the following conditions are met:

Vamos aceitar a licença para prosseguir com a instalação:

Do you accept the license terms? [yes|no]
[no] >>> yes

Agora basicamente é só pressionar ENTER para todas as perguntas a seguir, para fazer a instalação no diretório padrão:

Anaconda3 will now be installed into this location:
/home/alisson/anaconda3

  - Press ENTER to confirm the location
  - Press CTRL-C to abort the installation
  - Or specify a different location below

[/home/alisson/anaconda3] >>> 
PREFIX=/home/alisson/anaconda3

Como a Anaconda tem parceria com a Microsoft, eles recomendam instalar o VSCode para escrever os seus códigos, mas isso é opcional, no meu caso já estava instalado:

===========================================================================

Anaconda is partnered with Microsoft! Microsoft VSCode is a streamlined
code editor with support for development operations like debugging, task
running and version control.

To install Visual Studio Code, you will need:
  - Administrator Privileges
  - Internet connectivity

Visual Studio Code License: https://code.visualstudio.com/license

Do you wish to proceed with the installation of Microsoft VSCode? [yes|no]
>>> yes
Proceeding with installation of Microsoft VSCode
VSCode is already installed!

Agora que tudo já está instalado, vou abrir um novo terminal e criar uma pasta onde vou armazenar os projetos:

$ mkdir blog_responsus/

E iniciar o jupyter notebook:

alisson@alisson-avell:~/blog_responsus$ jupyter notebook pa

A saída do comando será parecida com essa:

[I 10:56:24.754 NotebookApp] JupyterLab beta preview extension loaded from /home/alisson/anaconda3/lib/python3.6/site-packages/jupyterlab
[I 10:56:24.754 NotebookApp] JupyterLab application directory is /home/alisson/anaconda3/share/jupyter/lab
[I 10:56:24.758 NotebookApp] Serving notebooks from local directory: /home/alisson/blog_responsus
[I 10:56:24.758 NotebookApp] 0 active kernels
[I 10:56:24.758 NotebookApp] The Jupyter Notebook is running at:
[I 10:56:24.758 NotebookApp] http://localhost:8888/?token=a72394b9a1a0fe8b27278e5855c03113c78003eb3bb4b6c7
[I 10:56:24.758 NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation).
[C 10:56:24.759 NotebookApp] 
    
    Copy/paste this URL into your browser when you connect for the first time,
    to login with a token:
        http://localhost:8888/?token=a72394b9a1a0fe8b27278e5855c03113c78003eb3bb4b6c7&token=a72394b9a1a0fe8b27278e5855c03113c78003eb3bb4b6c7

Note que no final tem a url de acesso que pode ser feita em qualquer navegador, desde que copiado o token junto.

Será aberta uma página similar a essa:

Agora vamos criar um primeiro script python, seguindo os passos da imagem abaixo:

E na página a seguir vamos colocar o nosso primeiro código Python:

Valeu!

CURSOSCONSULTORIA    CONTATO

Anterior IBM compra a RedHat por US$34 bilhões e o que isso muda na vida do SysAdmin?
Próxima Moodle: agendando tarefas através de plugins

About author

Alisson Machado
Alisson Machado 19 posts

Alisson Menezes, atua como Gerente de T.I, 9 anos de experiência em projetos FOSS (Free and Open Source Software) e Python. Formação em Análise de Sistemas pela FMU e cursando MBA em BigData pela FIA, possui certificações LPI1, LPI2 e SUSE CLA, LPI DevOps e Exim - DevOps Professional. Autor dos cursos Python Fundamentals, Python for Sysadmins, MongoDB for Developers/DBAs, DevSecOps, Co-Autor do Infraestrutura Ágil e Docker da 4Linux e palestrantes em eventos como FISL, TDC e Python Brasil. É entusiasta das mais diversas áreas em T.I como Segurança, Bancos de dados NoSQL, DataScience mas tem como foco DevOps e Automação.

View all posts by this author →

Você pode gostar também

Desenvolvimento

Por que usar Python como linguagem de programação para Big Data?

A maioria dos profissionais da área de Big Data possui uma dúvida em comum: qual linguagem de programação certa para um projeto que envolva um grande volume de dados? O

Treinamentos

Com lançamento do curso de Hadoop, 4linux passa a ofertar treinamentos para área de BigData.

A 4Linux informa nesta data o lançamento  do treinamento Big Data Analytics com Hadoop , o primeiro curso na área de big data da 4Linux. O Hadoop é um projeto de

Big Data

Fusão da Cloudera com a Hortonworks – Como isto impacta o mundo de TI e o profissional de Big Data?

Grande mudança no mercado de Big Data Uma notícia no final de 2018 causou muita surpresa no mundo de TI, em especial, para a área de Big Data. A Cloudera