La datascience couvre la collecte, la compréhension, la transformation et l’exposition de la donnée.

Elle repose sur l’idée qu’un ensemble de données peut être porteur d’informations holistes, donc non détectables par une analyse des données prises individuellement.

La datascience est à comparer aux autres techniques d’analyse de données telles que la statistique ou le datamining.

Elle trouve sa différence principalement dans son approche de la donnée. La datascience vise à traiter en premier lieu les signaux faibles, plus porteurs de connaissance que les signaux récurrents, et donc à disposer d’une notion d’essentialité différente de celle mise en œuvre par les statisticiens et les dataminers.