{ "cells": [ { "cell_type": "markdown", "source": [ "# Wyzwanie: Analiza tekstu o Data Science\n", "\n", "W tym przykładzie wykonamy proste ćwiczenie obejmujące wszystkie kroki tradycyjnego procesu Data Science. Nie musisz pisać żadnego kodu, wystarczy kliknąć na poniższe komórki, aby je uruchomić i obserwować wynik. Jako wyzwanie, zachęcamy do wypróbowania tego kodu z różnymi danymi.\n", "\n", "## Cel\n", "\n", "W tej lekcji omawialiśmy różne pojęcia związane z Data Science. Spróbujmy odkryć więcej powiązanych koncepcji, wykonując **analizę tekstu**. Zaczniemy od tekstu o Data Science, wyodrębnimy z niego słowa kluczowe, a następnie spróbujemy zwizualizować wynik.\n", "\n", "Jako tekst wykorzystamy stronę o Data Science z Wikipedii:\n" ], "metadata": {} }, { "cell_type": "markdown", "source": [], "metadata": {} }, { "cell_type": "code", "execution_count": 62, "source": [ "url = 'https://en.wikipedia.org/wiki/Data_science'" ], "outputs": [], "metadata": {} }, { "cell_type": "markdown", "source": [ "## Krok 1: Pobieranie danych\n", "\n", "Pierwszym krokiem w każdym procesie analizy danych jest pobranie danych. W tym celu użyjemy biblioteki `requests`:\n" ], "metadata": {} }, { "cell_type": "code", "execution_count": 63, "source": [ "import requests\r\n", "\r\n", "text = requests.get(url).content.decode('utf-8')\r\n", "print(text[:1000])" ], "outputs": [ { "output_type": "stream", "name": "stdout", "text": [ "\n", "\n", "\n", "\n", "Data science - Wikipedia\n", "