{ "cells": [ { "cell_type": "markdown", "source": [ "# Tantangan: Menganalisis Teks tentang Data Science\n", "\n", "Dalam contoh ini, mari kita lakukan latihan sederhana yang mencakup semua langkah dalam proses data science tradisional. Anda tidak perlu menulis kode apa pun, cukup klik pada sel di bawah ini untuk menjalankannya dan amati hasilnya. Sebagai tantangan, Anda didorong untuk mencoba kode ini dengan data yang berbeda.\n", "\n", "## Tujuan\n", "\n", "Dalam pelajaran ini, kita telah membahas berbagai konsep yang berkaitan dengan Data Science. Mari kita coba menemukan lebih banyak konsep terkait dengan melakukan **text mining**. Kita akan memulai dengan sebuah teks tentang Data Science, mengekstrak kata kunci darinya, dan kemudian mencoba memvisualisasikan hasilnya.\n", "\n", "Sebagai teks, saya akan menggunakan halaman tentang Data Science dari Wikipedia:\n" ], "metadata": {} }, { "cell_type": "markdown", "source": [], "metadata": {} }, { "cell_type": "code", "execution_count": 62, "source": [ "url = 'https://en.wikipedia.org/wiki/Data_science'" ], "outputs": [], "metadata": {} }, { "cell_type": "markdown", "source": [ "## Langkah 1: Mendapatkan Data\n", "\n", "Langkah pertama dalam setiap proses ilmu data adalah mendapatkan data. Kita akan menggunakan pustaka `requests` untuk melakukannya:\n" ], "metadata": {} }, { "cell_type": "code", "execution_count": 63, "source": [ "import requests\r\n", "\r\n", "text = requests.get(url).content.decode('utf-8')\r\n", "print(text[:1000])" ], "outputs": [ { "output_type": "stream", "name": "stdout", "text": [ "\n", "\n", "
\n", "\n", "