correlogramme Portail de la Science des données

Ce portail vise à rassembler les articles autour de la donnée, de la datascience, des technologies Big data et de la DataViz (Data visualisation)

213 articles sont actuellement liés au portail


Outils informatiques

HadoopTableau Software

Autour de Hadoop : Apache DrillApache FlumeApache HiveApache KafkaApache OozieApache PigApache SparkApache SqoopApache ZeppelinApache ZooKeeperClouderaHortonworksMapRHBaseImpala (Cloudera)MapReducePresto (moteur de requête SQL)Hadoop YARNElasticsearchSolrHue (Hadoop)Apache AtlasApache Sentry

Langages : R (langage de programmation et environnement statistique) (Ggplot2) • Scala (langage)Python (langage) (Scikit-learn) • Julia (langage de programmation)SQL

Divers : VagrantApache MahoutKubeflowGraphQLApache NiFi

Jeux de données : Iris (jeu de données)Demande de valeurs foncières

Logiciels : Tanagra RStudioSASSPSSOrangeH2O.aiVisual Studio CodeAnaconda

Bases de données : MongoDBCassandraCouchDBHBaseMySQLSQL Server

Formats de données : JSONXMLCSVTabulation-separated valuesPredictive Model Markup LanguageYAML

Formats de données Big data : Apache AvroApache ParquetProtocol Buffers

Outils de Business Intelligence : TableauPower BI

Bibliothèques Python : PandasNumPyMatplotlibScikit-learnTensorFlowPyTorchSciPyKeras

Concepts : Data lakeDatamartDatawarehouseODSArchitecture LambdaData Lineage

ETL & traitement de la données  : TalendOracle Data IntegratorESBEAIApache Airflow

Ailleurs que sur Wikipédia