diff --git a/translated_images/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.he.png b/translated_images/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.he.png
new file mode 100644
index 00000000..935894b0
Binary files /dev/null and b/translated_images/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.he.png differ
diff --git a/translated_images/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.nl.png b/translated_images/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.nl.png
new file mode 100644
index 00000000..e2aa6f01
Binary files /dev/null and b/translated_images/00-Roadmap.4905d6567dff47532b9bfb8e0b8980fc6b0b1292eebb24181c1a9753b33bc0f5.nl.png differ
diff --git a/translated_images/00-Title.8af36cd35da1ac555b678627fbdc6e320c75f0100876ea41d30ea205d3b08d22.he.png b/translated_images/00-Title.8af36cd35da1ac555b678627fbdc6e320c75f0100876ea41d30ea205d3b08d22.he.png
new file mode 100644
index 00000000..dd2e56c5
Binary files /dev/null and b/translated_images/00-Title.8af36cd35da1ac555b678627fbdc6e320c75f0100876ea41d30ea205d3b08d22.he.png differ
diff --git a/translated_images/00-Title.8af36cd35da1ac555b678627fbdc6e320c75f0100876ea41d30ea205d3b08d22.nl.png b/translated_images/00-Title.8af36cd35da1ac555b678627fbdc6e320c75f0100876ea41d30ea205d3b08d22.nl.png
new file mode 100644
index 00000000..65bda856
Binary files /dev/null and b/translated_images/00-Title.8af36cd35da1ac555b678627fbdc6e320c75f0100876ea41d30ea205d3b08d22.nl.png differ
diff --git a/translated_images/01-Definitions.1b14ddc9525dc0d9416a2f500f30e8652d21622f4e184100d405bd874ecbc17d.he.png b/translated_images/01-Definitions.1b14ddc9525dc0d9416a2f500f30e8652d21622f4e184100d405bd874ecbc17d.he.png
new file mode 100644
index 00000000..b045af8e
Binary files /dev/null and b/translated_images/01-Definitions.1b14ddc9525dc0d9416a2f500f30e8652d21622f4e184100d405bd874ecbc17d.he.png differ
diff --git a/translated_images/01-Definitions.1b14ddc9525dc0d9416a2f500f30e8652d21622f4e184100d405bd874ecbc17d.nl.png b/translated_images/01-Definitions.1b14ddc9525dc0d9416a2f500f30e8652d21622f4e184100d405bd874ecbc17d.nl.png
new file mode 100644
index 00000000..69b2dcd4
Binary files /dev/null and b/translated_images/01-Definitions.1b14ddc9525dc0d9416a2f500f30e8652d21622f4e184100d405bd874ecbc17d.nl.png differ
diff --git a/translated_images/02-Ethics.728d166895302ab09c726c2a8385abbf7c3e36752f0ee933bba7ea8f78f5cdca.he.png b/translated_images/02-Ethics.728d166895302ab09c726c2a8385abbf7c3e36752f0ee933bba7ea8f78f5cdca.he.png
new file mode 100644
index 00000000..06dea54c
Binary files /dev/null and b/translated_images/02-Ethics.728d166895302ab09c726c2a8385abbf7c3e36752f0ee933bba7ea8f78f5cdca.he.png differ
diff --git a/translated_images/02-Ethics.728d166895302ab09c726c2a8385abbf7c3e36752f0ee933bba7ea8f78f5cdca.nl.png b/translated_images/02-Ethics.728d166895302ab09c726c2a8385abbf7c3e36752f0ee933bba7ea8f78f5cdca.nl.png
new file mode 100644
index 00000000..61835ff8
Binary files /dev/null and b/translated_images/02-Ethics.728d166895302ab09c726c2a8385abbf7c3e36752f0ee933bba7ea8f78f5cdca.nl.png differ
diff --git a/translated_images/03-DefiningData.f800817186949e078a81e7d5fdf9bb83834e561316bf790d4645c970ed4ff9ae.he.png b/translated_images/03-DefiningData.f800817186949e078a81e7d5fdf9bb83834e561316bf790d4645c970ed4ff9ae.he.png
new file mode 100644
index 00000000..0c85c449
Binary files /dev/null and b/translated_images/03-DefiningData.f800817186949e078a81e7d5fdf9bb83834e561316bf790d4645c970ed4ff9ae.he.png differ
diff --git a/translated_images/03-DefiningData.f800817186949e078a81e7d5fdf9bb83834e561316bf790d4645c970ed4ff9ae.nl.png b/translated_images/03-DefiningData.f800817186949e078a81e7d5fdf9bb83834e561316bf790d4645c970ed4ff9ae.nl.png
new file mode 100644
index 00000000..cab916fc
Binary files /dev/null and b/translated_images/03-DefiningData.f800817186949e078a81e7d5fdf9bb83834e561316bf790d4645c970ed4ff9ae.nl.png differ
diff --git a/translated_images/04-Statistics-Probability.cfc569d84a9f186748b69af7fdac3fa560329ccfc0e28994bfa65450ed78bdde.he.png b/translated_images/04-Statistics-Probability.cfc569d84a9f186748b69af7fdac3fa560329ccfc0e28994bfa65450ed78bdde.he.png
new file mode 100644
index 00000000..2169958e
Binary files /dev/null and b/translated_images/04-Statistics-Probability.cfc569d84a9f186748b69af7fdac3fa560329ccfc0e28994bfa65450ed78bdde.he.png differ
diff --git a/translated_images/04-Statistics-Probability.cfc569d84a9f186748b69af7fdac3fa560329ccfc0e28994bfa65450ed78bdde.nl.png b/translated_images/04-Statistics-Probability.cfc569d84a9f186748b69af7fdac3fa560329ccfc0e28994bfa65450ed78bdde.nl.png
new file mode 100644
index 00000000..5ebc5802
Binary files /dev/null and b/translated_images/04-Statistics-Probability.cfc569d84a9f186748b69af7fdac3fa560329ccfc0e28994bfa65450ed78bdde.nl.png differ
diff --git a/translated_images/05-RelationalData.af50f5a3e50f7456f1d895326b489d3b3f608a09abc28933d5dc6ba6ac191565.he.png b/translated_images/05-RelationalData.af50f5a3e50f7456f1d895326b489d3b3f608a09abc28933d5dc6ba6ac191565.he.png
new file mode 100644
index 00000000..d8457452
Binary files /dev/null and b/translated_images/05-RelationalData.af50f5a3e50f7456f1d895326b489d3b3f608a09abc28933d5dc6ba6ac191565.he.png differ
diff --git a/translated_images/05-RelationalData.af50f5a3e50f7456f1d895326b489d3b3f608a09abc28933d5dc6ba6ac191565.nl.png b/translated_images/05-RelationalData.af50f5a3e50f7456f1d895326b489d3b3f608a09abc28933d5dc6ba6ac191565.nl.png
new file mode 100644
index 00000000..2cba3c54
Binary files /dev/null and b/translated_images/05-RelationalData.af50f5a3e50f7456f1d895326b489d3b3f608a09abc28933d5dc6ba6ac191565.nl.png differ
diff --git a/translated_images/06-NoSQL.42a91ea0cd5769fe43e3c21554eb6d308b1fdf1435a6ae7c47b1a9dedab2da84.he.png b/translated_images/06-NoSQL.42a91ea0cd5769fe43e3c21554eb6d308b1fdf1435a6ae7c47b1a9dedab2da84.he.png
new file mode 100644
index 00000000..17ecbff2
Binary files /dev/null and b/translated_images/06-NoSQL.42a91ea0cd5769fe43e3c21554eb6d308b1fdf1435a6ae7c47b1a9dedab2da84.he.png differ
diff --git a/translated_images/06-NoSQL.42a91ea0cd5769fe43e3c21554eb6d308b1fdf1435a6ae7c47b1a9dedab2da84.nl.png b/translated_images/06-NoSQL.42a91ea0cd5769fe43e3c21554eb6d308b1fdf1435a6ae7c47b1a9dedab2da84.nl.png
new file mode 100644
index 00000000..ac089d21
Binary files /dev/null and b/translated_images/06-NoSQL.42a91ea0cd5769fe43e3c21554eb6d308b1fdf1435a6ae7c47b1a9dedab2da84.nl.png differ
diff --git a/translated_images/07-WorkWithPython.8bf4a5013718bef90cb3887355e158974494de38d2ad420b6cdce2fcd982cd89.he.png b/translated_images/07-WorkWithPython.8bf4a5013718bef90cb3887355e158974494de38d2ad420b6cdce2fcd982cd89.he.png
new file mode 100644
index 00000000..2120b5bf
Binary files /dev/null and b/translated_images/07-WorkWithPython.8bf4a5013718bef90cb3887355e158974494de38d2ad420b6cdce2fcd982cd89.he.png differ
diff --git a/translated_images/07-WorkWithPython.8bf4a5013718bef90cb3887355e158974494de38d2ad420b6cdce2fcd982cd89.nl.png b/translated_images/07-WorkWithPython.8bf4a5013718bef90cb3887355e158974494de38d2ad420b6cdce2fcd982cd89.nl.png
new file mode 100644
index 00000000..f7eeb54a
Binary files /dev/null and b/translated_images/07-WorkWithPython.8bf4a5013718bef90cb3887355e158974494de38d2ad420b6cdce2fcd982cd89.nl.png differ
diff --git a/translated_images/08-DataPreparation.e3b185c37958e96435267555edc6e54f2eb0f2d18745cfd550d3f9ba34877072.he.png b/translated_images/08-DataPreparation.e3b185c37958e96435267555edc6e54f2eb0f2d18745cfd550d3f9ba34877072.he.png
new file mode 100644
index 00000000..8d7fd02d
Binary files /dev/null and b/translated_images/08-DataPreparation.e3b185c37958e96435267555edc6e54f2eb0f2d18745cfd550d3f9ba34877072.he.png differ
diff --git a/translated_images/08-DataPreparation.e3b185c37958e96435267555edc6e54f2eb0f2d18745cfd550d3f9ba34877072.nl.png b/translated_images/08-DataPreparation.e3b185c37958e96435267555edc6e54f2eb0f2d18745cfd550d3f9ba34877072.nl.png
new file mode 100644
index 00000000..660deb80
Binary files /dev/null and b/translated_images/08-DataPreparation.e3b185c37958e96435267555edc6e54f2eb0f2d18745cfd550d3f9ba34877072.nl.png differ
diff --git a/translated_images/09-Visualizing-Quantities.5c846edd805a5238789865f960b1e2615b6889c715852f02a20a722484d97fbb.he.png b/translated_images/09-Visualizing-Quantities.5c846edd805a5238789865f960b1e2615b6889c715852f02a20a722484d97fbb.he.png
new file mode 100644
index 00000000..7cec0fe1
Binary files /dev/null and b/translated_images/09-Visualizing-Quantities.5c846edd805a5238789865f960b1e2615b6889c715852f02a20a722484d97fbb.he.png differ
diff --git a/translated_images/09-Visualizing-Quantities.5c846edd805a5238789865f960b1e2615b6889c715852f02a20a722484d97fbb.nl.png b/translated_images/09-Visualizing-Quantities.5c846edd805a5238789865f960b1e2615b6889c715852f02a20a722484d97fbb.nl.png
new file mode 100644
index 00000000..5aa74145
Binary files /dev/null and b/translated_images/09-Visualizing-Quantities.5c846edd805a5238789865f960b1e2615b6889c715852f02a20a722484d97fbb.nl.png differ
diff --git a/translated_images/10-Visualizing-Distributions.8097fd8abd7221a1da63a156aaca497d844697e6a0ef0bbf8795e0f6a0bf7309.he.png b/translated_images/10-Visualizing-Distributions.8097fd8abd7221a1da63a156aaca497d844697e6a0ef0bbf8795e0f6a0bf7309.he.png
new file mode 100644
index 00000000..c2ea6d7d
Binary files /dev/null and b/translated_images/10-Visualizing-Distributions.8097fd8abd7221a1da63a156aaca497d844697e6a0ef0bbf8795e0f6a0bf7309.he.png differ
diff --git a/translated_images/10-Visualizing-Distributions.8097fd8abd7221a1da63a156aaca497d844697e6a0ef0bbf8795e0f6a0bf7309.nl.png b/translated_images/10-Visualizing-Distributions.8097fd8abd7221a1da63a156aaca497d844697e6a0ef0bbf8795e0f6a0bf7309.nl.png
new file mode 100644
index 00000000..30de11ca
Binary files /dev/null and b/translated_images/10-Visualizing-Distributions.8097fd8abd7221a1da63a156aaca497d844697e6a0ef0bbf8795e0f6a0bf7309.nl.png differ
diff --git a/translated_images/11-Visualizing-Proportions.3e82f24af94d206e51faf9aff1b454a52c8e69887296ac549d6286450cc64d1f.he.png b/translated_images/11-Visualizing-Proportions.3e82f24af94d206e51faf9aff1b454a52c8e69887296ac549d6286450cc64d1f.he.png
new file mode 100644
index 00000000..3ac9dee8
Binary files /dev/null and b/translated_images/11-Visualizing-Proportions.3e82f24af94d206e51faf9aff1b454a52c8e69887296ac549d6286450cc64d1f.he.png differ
diff --git a/translated_images/11-Visualizing-Proportions.3e82f24af94d206e51faf9aff1b454a52c8e69887296ac549d6286450cc64d1f.nl.png b/translated_images/11-Visualizing-Proportions.3e82f24af94d206e51faf9aff1b454a52c8e69887296ac549d6286450cc64d1f.nl.png
new file mode 100644
index 00000000..94869ee9
Binary files /dev/null and b/translated_images/11-Visualizing-Proportions.3e82f24af94d206e51faf9aff1b454a52c8e69887296ac549d6286450cc64d1f.nl.png differ
diff --git a/translated_images/12-Visualizing-Relationships.4466f9bd260f03dd29dc04933456ade8466d7ed2a37a98b78ed47f061488d57a.he.png b/translated_images/12-Visualizing-Relationships.4466f9bd260f03dd29dc04933456ade8466d7ed2a37a98b78ed47f061488d57a.he.png
new file mode 100644
index 00000000..e7819f31
Binary files /dev/null and b/translated_images/12-Visualizing-Relationships.4466f9bd260f03dd29dc04933456ade8466d7ed2a37a98b78ed47f061488d57a.he.png differ
diff --git a/translated_images/12-Visualizing-Relationships.4466f9bd260f03dd29dc04933456ade8466d7ed2a37a98b78ed47f061488d57a.nl.png b/translated_images/12-Visualizing-Relationships.4466f9bd260f03dd29dc04933456ade8466d7ed2a37a98b78ed47f061488d57a.nl.png
new file mode 100644
index 00000000..8baeb2e3
Binary files /dev/null and b/translated_images/12-Visualizing-Relationships.4466f9bd260f03dd29dc04933456ade8466d7ed2a37a98b78ed47f061488d57a.nl.png differ
diff --git a/translated_images/13-MeaningfulViz.4db6f1997e519908c85e4b9b3b54609b2e9e90a27be9423a9b956ab9a7329c80.he.png b/translated_images/13-MeaningfulViz.4db6f1997e519908c85e4b9b3b54609b2e9e90a27be9423a9b956ab9a7329c80.he.png
new file mode 100644
index 00000000..cf7b425c
Binary files /dev/null and b/translated_images/13-MeaningfulViz.4db6f1997e519908c85e4b9b3b54609b2e9e90a27be9423a9b956ab9a7329c80.he.png differ
diff --git a/translated_images/13-MeaningfulViz.4db6f1997e519908c85e4b9b3b54609b2e9e90a27be9423a9b956ab9a7329c80.nl.png b/translated_images/13-MeaningfulViz.4db6f1997e519908c85e4b9b3b54609b2e9e90a27be9423a9b956ab9a7329c80.nl.png
new file mode 100644
index 00000000..cfd7287b
Binary files /dev/null and b/translated_images/13-MeaningfulViz.4db6f1997e519908c85e4b9b3b54609b2e9e90a27be9423a9b956ab9a7329c80.nl.png differ
diff --git a/translated_images/14-DataScience-Lifecycle.2c9f277e4d69fbaadc814c2b295be5e2df8f006b80543a974d109324f0897b7b.he.png b/translated_images/14-DataScience-Lifecycle.2c9f277e4d69fbaadc814c2b295be5e2df8f006b80543a974d109324f0897b7b.he.png
new file mode 100644
index 00000000..96bb531b
Binary files /dev/null and b/translated_images/14-DataScience-Lifecycle.2c9f277e4d69fbaadc814c2b295be5e2df8f006b80543a974d109324f0897b7b.he.png differ
diff --git a/translated_images/14-DataScience-Lifecycle.2c9f277e4d69fbaadc814c2b295be5e2df8f006b80543a974d109324f0897b7b.nl.png b/translated_images/14-DataScience-Lifecycle.2c9f277e4d69fbaadc814c2b295be5e2df8f006b80543a974d109324f0897b7b.nl.png
new file mode 100644
index 00000000..ac73cc7d
Binary files /dev/null and b/translated_images/14-DataScience-Lifecycle.2c9f277e4d69fbaadc814c2b295be5e2df8f006b80543a974d109324f0897b7b.nl.png differ
diff --git a/translated_images/15-Analyzing.b501f3dbdc958f6fab0a507e307381c29e76707c3c41e174977e380a8b4063a9.he.png b/translated_images/15-Analyzing.b501f3dbdc958f6fab0a507e307381c29e76707c3c41e174977e380a8b4063a9.he.png
new file mode 100644
index 00000000..e4f0f35d
Binary files /dev/null and b/translated_images/15-Analyzing.b501f3dbdc958f6fab0a507e307381c29e76707c3c41e174977e380a8b4063a9.he.png differ
diff --git a/translated_images/15-Analyzing.b501f3dbdc958f6fab0a507e307381c29e76707c3c41e174977e380a8b4063a9.nl.png b/translated_images/15-Analyzing.b501f3dbdc958f6fab0a507e307381c29e76707c3c41e174977e380a8b4063a9.nl.png
new file mode 100644
index 00000000..fc06f3fb
Binary files /dev/null and b/translated_images/15-Analyzing.b501f3dbdc958f6fab0a507e307381c29e76707c3c41e174977e380a8b4063a9.nl.png differ
diff --git a/translated_images/16-Communicating.f1d29cd7984442a4804d0df8b7e8438b1abc7c1fcf5b3471e89eaf2e9ba087d9.he.png b/translated_images/16-Communicating.f1d29cd7984442a4804d0df8b7e8438b1abc7c1fcf5b3471e89eaf2e9ba087d9.he.png
new file mode 100644
index 00000000..1699aaca
Binary files /dev/null and b/translated_images/16-Communicating.f1d29cd7984442a4804d0df8b7e8438b1abc7c1fcf5b3471e89eaf2e9ba087d9.he.png differ
diff --git a/translated_images/16-Communicating.f1d29cd7984442a4804d0df8b7e8438b1abc7c1fcf5b3471e89eaf2e9ba087d9.nl.png b/translated_images/16-Communicating.f1d29cd7984442a4804d0df8b7e8438b1abc7c1fcf5b3471e89eaf2e9ba087d9.nl.png
new file mode 100644
index 00000000..b92b8944
Binary files /dev/null and b/translated_images/16-Communicating.f1d29cd7984442a4804d0df8b7e8438b1abc7c1fcf5b3471e89eaf2e9ba087d9.nl.png differ
diff --git a/translated_images/17-DataScience-Cloud.0df76ac874805c141082935ca07e8eca7d3790b83df25d641a807495e4f19de2.he.png b/translated_images/17-DataScience-Cloud.0df76ac874805c141082935ca07e8eca7d3790b83df25d641a807495e4f19de2.he.png
new file mode 100644
index 00000000..82683648
Binary files /dev/null and b/translated_images/17-DataScience-Cloud.0df76ac874805c141082935ca07e8eca7d3790b83df25d641a807495e4f19de2.he.png differ
diff --git a/translated_images/17-DataScience-Cloud.0df76ac874805c141082935ca07e8eca7d3790b83df25d641a807495e4f19de2.nl.png b/translated_images/17-DataScience-Cloud.0df76ac874805c141082935ca07e8eca7d3790b83df25d641a807495e4f19de2.nl.png
new file mode 100644
index 00000000..2931c5c8
Binary files /dev/null and b/translated_images/17-DataScience-Cloud.0df76ac874805c141082935ca07e8eca7d3790b83df25d641a807495e4f19de2.nl.png differ
diff --git a/translated_images/18-DataScience-Cloud.3a7292e8182b74ebfe5b246c0193c42592164aef625fe66e44194c19b2971f1a.he.png b/translated_images/18-DataScience-Cloud.3a7292e8182b74ebfe5b246c0193c42592164aef625fe66e44194c19b2971f1a.he.png
new file mode 100644
index 00000000..625e0803
Binary files /dev/null and b/translated_images/18-DataScience-Cloud.3a7292e8182b74ebfe5b246c0193c42592164aef625fe66e44194c19b2971f1a.he.png differ
diff --git a/translated_images/18-DataScience-Cloud.3a7292e8182b74ebfe5b246c0193c42592164aef625fe66e44194c19b2971f1a.nl.png b/translated_images/18-DataScience-Cloud.3a7292e8182b74ebfe5b246c0193c42592164aef625fe66e44194c19b2971f1a.nl.png
new file mode 100644
index 00000000..32f59411
Binary files /dev/null and b/translated_images/18-DataScience-Cloud.3a7292e8182b74ebfe5b246c0193c42592164aef625fe66e44194c19b2971f1a.nl.png differ
diff --git a/translated_images/19-DataScience-Cloud.177b38fb86301fc6f06dea5b25a58f8abe1aa762d3a815d811c83ee22d8a8d6a.he.png b/translated_images/19-DataScience-Cloud.177b38fb86301fc6f06dea5b25a58f8abe1aa762d3a815d811c83ee22d8a8d6a.he.png
new file mode 100644
index 00000000..e3924786
Binary files /dev/null and b/translated_images/19-DataScience-Cloud.177b38fb86301fc6f06dea5b25a58f8abe1aa762d3a815d811c83ee22d8a8d6a.he.png differ
diff --git a/translated_images/19-DataScience-Cloud.177b38fb86301fc6f06dea5b25a58f8abe1aa762d3a815d811c83ee22d8a8d6a.nl.png b/translated_images/19-DataScience-Cloud.177b38fb86301fc6f06dea5b25a58f8abe1aa762d3a815d811c83ee22d8a8d6a.nl.png
new file mode 100644
index 00000000..a2ff3203
Binary files /dev/null and b/translated_images/19-DataScience-Cloud.177b38fb86301fc6f06dea5b25a58f8abe1aa762d3a815d811c83ee22d8a8d6a.nl.png differ
diff --git a/translated_images/20-DataScience-Humanities.1d1a155f4d12a6679eb4f2be1074a456957f00affe8137c9cb22dedd6e7337e7.he.png b/translated_images/20-DataScience-Humanities.1d1a155f4d12a6679eb4f2be1074a456957f00affe8137c9cb22dedd6e7337e7.he.png
new file mode 100644
index 00000000..7c47e2f7
Binary files /dev/null and b/translated_images/20-DataScience-Humanities.1d1a155f4d12a6679eb4f2be1074a456957f00affe8137c9cb22dedd6e7337e7.he.png differ
diff --git a/translated_images/20-DataScience-Humanities.1d1a155f4d12a6679eb4f2be1074a456957f00affe8137c9cb22dedd6e7337e7.nl.png b/translated_images/20-DataScience-Humanities.1d1a155f4d12a6679eb4f2be1074a456957f00affe8137c9cb22dedd6e7337e7.nl.png
new file mode 100644
index 00000000..ac6494e1
Binary files /dev/null and b/translated_images/20-DataScience-Humanities.1d1a155f4d12a6679eb4f2be1074a456957f00affe8137c9cb22dedd6e7337e7.nl.png differ
diff --git a/translated_images/20-DataScience-RealWorld.976976229ee113426d617ef7a1a8cb8f80f7b7bca6860a167b1ca155b891415b.he.png b/translated_images/20-DataScience-RealWorld.976976229ee113426d617ef7a1a8cb8f80f7b7bca6860a167b1ca155b891415b.he.png
new file mode 100644
index 00000000..8fdc116d
Binary files /dev/null and b/translated_images/20-DataScience-RealWorld.976976229ee113426d617ef7a1a8cb8f80f7b7bca6860a167b1ca155b891415b.he.png differ
diff --git a/translated_images/20-DataScience-RealWorld.976976229ee113426d617ef7a1a8cb8f80f7b7bca6860a167b1ca155b891415b.nl.png b/translated_images/20-DataScience-RealWorld.976976229ee113426d617ef7a1a8cb8f80f7b7bca6860a167b1ca155b891415b.nl.png
new file mode 100644
index 00000000..b3664fed
Binary files /dev/null and b/translated_images/20-DataScience-RealWorld.976976229ee113426d617ef7a1a8cb8f80f7b7bca6860a167b1ca155b891415b.nl.png differ
diff --git a/translated_images/20-DataScience-Research.da434814c51b4ef8cd15a8efa161d066eff282b59286a2ab33b834434df96db9.he.png b/translated_images/20-DataScience-Research.da434814c51b4ef8cd15a8efa161d066eff282b59286a2ab33b834434df96db9.he.png
new file mode 100644
index 00000000..09812a32
Binary files /dev/null and b/translated_images/20-DataScience-Research.da434814c51b4ef8cd15a8efa161d066eff282b59286a2ab33b834434df96db9.he.png differ
diff --git a/translated_images/20-DataScience-Research.da434814c51b4ef8cd15a8efa161d066eff282b59286a2ab33b834434df96db9.nl.png b/translated_images/20-DataScience-Research.da434814c51b4ef8cd15a8efa161d066eff282b59286a2ab33b834434df96db9.nl.png
new file mode 100644
index 00000000..661b1f75
Binary files /dev/null and b/translated_images/20-DataScience-Research.da434814c51b4ef8cd15a8efa161d066eff282b59286a2ab33b834434df96db9.nl.png differ
diff --git a/translated_images/20-DataScience-Sustainability.d4097bc684431da6b8f4b5f60896b6db7ca915f2366774416b2cd9939609a0c4.he.png b/translated_images/20-DataScience-Sustainability.d4097bc684431da6b8f4b5f60896b6db7ca915f2366774416b2cd9939609a0c4.he.png
new file mode 100644
index 00000000..f7fe5e99
Binary files /dev/null and b/translated_images/20-DataScience-Sustainability.d4097bc684431da6b8f4b5f60896b6db7ca915f2366774416b2cd9939609a0c4.he.png differ
diff --git a/translated_images/20-DataScience-Sustainability.d4097bc684431da6b8f4b5f60896b6db7ca915f2366774416b2cd9939609a0c4.nl.png b/translated_images/20-DataScience-Sustainability.d4097bc684431da6b8f4b5f60896b6db7ca915f2366774416b2cd9939609a0c4.nl.png
new file mode 100644
index 00000000..a64cc586
Binary files /dev/null and b/translated_images/20-DataScience-Sustainability.d4097bc684431da6b8f4b5f60896b6db7ca915f2366774416b2cd9939609a0c4.nl.png differ
diff --git a/translated_images/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.he.png b/translated_images/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.he.png
new file mode 100644
index 00000000..188d7177
Binary files /dev/null and b/translated_images/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.he.png differ
diff --git a/translated_images/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.nl.png b/translated_images/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.nl.png
new file mode 100644
index 00000000..9876f25c
Binary files /dev/null and b/translated_images/2D-wb.ae22fdd33936507a41e3af22e11e4903b04a9be973b23a4e05214efaccfd66c8.nl.png differ
diff --git a/translated_images/2D.b3342157139dd804f8fb5adc58721f77e59273fc980175b4ef735ec18686713c.he.png b/translated_images/2D.b3342157139dd804f8fb5adc58721f77e59273fc980175b4ef735ec18686713c.he.png
new file mode 100644
index 00000000..1de3c95a
Binary files /dev/null and b/translated_images/2D.b3342157139dd804f8fb5adc58721f77e59273fc980175b4ef735ec18686713c.he.png differ
diff --git a/translated_images/2D.b3342157139dd804f8fb5adc58721f77e59273fc980175b4ef735ec18686713c.nl.png b/translated_images/2D.b3342157139dd804f8fb5adc58721f77e59273fc980175b4ef735ec18686713c.nl.png
new file mode 100644
index 00000000..3a85f737
Binary files /dev/null and b/translated_images/2D.b3342157139dd804f8fb5adc58721f77e59273fc980175b4ef735ec18686713c.nl.png differ
diff --git a/translated_images/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.he.png b/translated_images/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.he.png
new file mode 100644
index 00000000..4e064cb7
Binary files /dev/null and b/translated_images/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.he.png differ
diff --git a/translated_images/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.nl.png b/translated_images/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.nl.png
new file mode 100644
index 00000000..c1f97146
Binary files /dev/null and b/translated_images/2d-plot.c504786f439bd7ebceebf2465c70ca3b124103e06c7ff7214bf24e26f7aec21e.nl.png differ
diff --git a/translated_images/3d.0cec12bcc60f0ce7284c63baed1411a843e24716f7d7425de878715ebad54a15.he.png b/translated_images/3d.0cec12bcc60f0ce7284c63baed1411a843e24716f7d7425de878715ebad54a15.he.png
new file mode 100644
index 00000000..9b619baa
Binary files /dev/null and b/translated_images/3d.0cec12bcc60f0ce7284c63baed1411a843e24716f7d7425de878715ebad54a15.he.png differ
diff --git a/translated_images/3d.0cec12bcc60f0ce7284c63baed1411a843e24716f7d7425de878715ebad54a15.nl.png b/translated_images/3d.0cec12bcc60f0ce7284c63baed1411a843e24716f7d7425de878715ebad54a15.nl.png
new file mode 100644
index 00000000..d4d3c761
Binary files /dev/null and b/translated_images/3d.0cec12bcc60f0ce7284c63baed1411a843e24716f7d7425de878715ebad54a15.nl.png differ
diff --git a/translated_images/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.he.png b/translated_images/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.he.png
new file mode 100644
index 00000000..9b619baa
Binary files /dev/null and b/translated_images/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.he.png differ
diff --git a/translated_images/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.nl.png b/translated_images/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.nl.png
new file mode 100644
index 00000000..d4d3c761
Binary files /dev/null and b/translated_images/3d.db1734c151eee87d924989306a00e23f8cddac6a0aab122852ece220e9448def.nl.png differ
diff --git a/translated_images/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.he.png b/translated_images/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.he.png
new file mode 100644
index 00000000..02f9c5c8
Binary files /dev/null and b/translated_images/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.he.png differ
diff --git a/translated_images/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.nl.png b/translated_images/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.nl.png
new file mode 100644
index 00000000..0db0dce4
Binary files /dev/null and b/translated_images/CRISP-DM.8bad2b4c66e62aa75278009e38e3e99902c73b0a6f63fd605a67c687a536698c.nl.png differ
diff --git a/translated_images/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.he.png b/translated_images/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.he.png
new file mode 100644
index 00000000..2b0b9008
Binary files /dev/null and b/translated_images/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.he.png differ
diff --git a/translated_images/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.nl.png b/translated_images/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.nl.png
new file mode 100644
index 00000000..b2b725e6
Binary files /dev/null and b/translated_images/MaxWingspan-lineplot-improved.04b73b4d5a59552a6bc7590678899718e1f065abe9eada9ebb4148939b622fd4.nl.png differ
diff --git a/translated_images/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.he.png b/translated_images/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.he.png
new file mode 100644
index 00000000..12ed920f
Binary files /dev/null and b/translated_images/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.he.png differ
diff --git a/translated_images/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.nl.png b/translated_images/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.nl.png
new file mode 100644
index 00000000..88cbcb8e
Binary files /dev/null and b/translated_images/MaxWingspan-lineplot.b12169f99d26fdd263f291008dfd73c18a4ba8f3d32b1fda3d74af51a0a28616.nl.png differ
diff --git a/translated_images/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.he.png b/translated_images/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.he.png
new file mode 100644
index 00000000..d2fb1f5a
Binary files /dev/null and b/translated_images/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.he.png differ
diff --git a/translated_images/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.nl.png b/translated_images/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.nl.png
new file mode 100644
index 00000000..fea17f9a
Binary files /dev/null and b/translated_images/MaxWingspan-scatterplot-improved.7d0af81658c65f3e75b8fedeb2335399e31108257e48db15d875ece608272051.nl.png differ
diff --git a/translated_images/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.he.png b/translated_images/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.he.png
new file mode 100644
index 00000000..5f4763f9
Binary files /dev/null and b/translated_images/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.he.png differ
diff --git a/translated_images/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.nl.png b/translated_images/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.nl.png
new file mode 100644
index 00000000..6abf644c
Binary files /dev/null and b/translated_images/MaxWingspan-scatterplot.60dc9e0e19d32700283558f253841fdab5104abb62bc96f7d97f9c0ee857fa8b.nl.png differ
diff --git a/translated_images/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.he.png b/translated_images/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.he.png
new file mode 100644
index 00000000..db1c8d99
Binary files /dev/null and b/translated_images/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.he.png differ
diff --git a/translated_images/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.nl.png b/translated_images/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.nl.png
new file mode 100644
index 00000000..8ebcfabe
Binary files /dev/null and b/translated_images/aml-1.67281a85d3a1e2f34eb367b2d0f74e1039d13396e510f363cd8766632106d1ec.nl.png differ
diff --git a/translated_images/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.he.png b/translated_images/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.he.png
new file mode 100644
index 00000000..474cd4ad
Binary files /dev/null and b/translated_images/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.he.png differ
diff --git a/translated_images/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.nl.png b/translated_images/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.nl.png
new file mode 100644
index 00000000..832fe880
Binary files /dev/null and b/translated_images/aml-2.c9fb9cffb39ccbbe21ab9810ae937195d41a489744e15cff2b8477ed4dcae1ec.nl.png differ
diff --git a/translated_images/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.he.png b/translated_images/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.he.png
new file mode 100644
index 00000000..d75f03e4
Binary files /dev/null and b/translated_images/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.he.png differ
diff --git a/translated_images/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.nl.png b/translated_images/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.nl.png
new file mode 100644
index 00000000..8a9d9a68
Binary files /dev/null and b/translated_images/aml-3.a7952e4295f38cc6cdb0c7ed6dc71ea756b7fb5697ec126bc1220f87c5fa9231.nl.png differ
diff --git a/translated_images/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.he.png b/translated_images/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.he.png
new file mode 100644
index 00000000..1e860cda
Binary files /dev/null and b/translated_images/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.he.png differ
diff --git a/translated_images/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.nl.png b/translated_images/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.nl.png
new file mode 100644
index 00000000..f3548718
Binary files /dev/null and b/translated_images/aml-4.7a627e09cb6f16d0aa246059d9faee3d1725cc4258d0c8df15e801f73afc7e2c.nl.png differ
diff --git a/translated_images/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.he.png b/translated_images/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.he.png
new file mode 100644
index 00000000..bc82a10e
Binary files /dev/null and b/translated_images/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.he.png differ
diff --git a/translated_images/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.nl.png b/translated_images/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.nl.png
new file mode 100644
index 00000000..1637f559
Binary files /dev/null and b/translated_images/bad-chart-1.596bc93425a8ac301a28b8361f59a970276e7b961658ce849886aa1fed427341.nl.png differ
diff --git a/translated_images/bad-chart-1.93130f495b748bedfb3423d91b1e754d9026e17f94ad967aecdc9ca7203373bf.he.png b/translated_images/bad-chart-1.93130f495b748bedfb3423d91b1e754d9026e17f94ad967aecdc9ca7203373bf.he.png
new file mode 100644
index 00000000..ad5887e8
Binary files /dev/null and b/translated_images/bad-chart-1.93130f495b748bedfb3423d91b1e754d9026e17f94ad967aecdc9ca7203373bf.he.png differ
diff --git a/translated_images/bad-chart-1.93130f495b748bedfb3423d91b1e754d9026e17f94ad967aecdc9ca7203373bf.nl.png b/translated_images/bad-chart-1.93130f495b748bedfb3423d91b1e754d9026e17f94ad967aecdc9ca7203373bf.nl.png
new file mode 100644
index 00000000..1637f559
Binary files /dev/null and b/translated_images/bad-chart-1.93130f495b748bedfb3423d91b1e754d9026e17f94ad967aecdc9ca7203373bf.nl.png differ
diff --git a/translated_images/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.he.jpg b/translated_images/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.he.jpg
new file mode 100644
index 00000000..7a56e315
Binary files /dev/null and b/translated_images/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.he.jpg differ
diff --git a/translated_images/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.nl.jpg b/translated_images/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.nl.jpg
new file mode 100644
index 00000000..16e9f64c
Binary files /dev/null and b/translated_images/bad-chart-2.62edf4d2f30f4e519f5ef50c07ce686e27b0196a364febf9a4d98eecd21f9f60.nl.jpg differ
diff --git a/translated_images/bad-chart-2.c20e36dd4e6f617c0c325878dd421a563885bbf30a394884c147438827254e0e.he.jpg b/translated_images/bad-chart-2.c20e36dd4e6f617c0c325878dd421a563885bbf30a394884c147438827254e0e.he.jpg
new file mode 100644
index 00000000..e564eccf
Binary files /dev/null and b/translated_images/bad-chart-2.c20e36dd4e6f617c0c325878dd421a563885bbf30a394884c147438827254e0e.he.jpg differ
diff --git a/translated_images/bad-chart-2.c20e36dd4e6f617c0c325878dd421a563885bbf30a394884c147438827254e0e.nl.jpg b/translated_images/bad-chart-2.c20e36dd4e6f617c0c325878dd421a563885bbf30a394884c147438827254e0e.nl.jpg
new file mode 100644
index 00000000..c4d144dd
Binary files /dev/null and b/translated_images/bad-chart-2.c20e36dd4e6f617c0c325878dd421a563885bbf30a394884c147438827254e0e.nl.jpg differ
diff --git a/translated_images/bad-chart-3.6865d0afac4108d737558d90a61547d23a8722896397ec792264ee51a1be4be5.he.jpg b/translated_images/bad-chart-3.6865d0afac4108d737558d90a61547d23a8722896397ec792264ee51a1be4be5.he.jpg
new file mode 100644
index 00000000..56b770cd
Binary files /dev/null and b/translated_images/bad-chart-3.6865d0afac4108d737558d90a61547d23a8722896397ec792264ee51a1be4be5.he.jpg differ
diff --git a/translated_images/bad-chart-3.6865d0afac4108d737558d90a61547d23a8722896397ec792264ee51a1be4be5.nl.jpg b/translated_images/bad-chart-3.6865d0afac4108d737558d90a61547d23a8722896397ec792264ee51a1be4be5.nl.jpg
new file mode 100644
index 00000000..80f9a477
Binary files /dev/null and b/translated_images/bad-chart-3.6865d0afac4108d737558d90a61547d23a8722896397ec792264ee51a1be4be5.nl.jpg differ
diff --git a/translated_images/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.he.jpg b/translated_images/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.he.jpg
new file mode 100644
index 00000000..e1836b3b
Binary files /dev/null and b/translated_images/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.he.jpg differ
diff --git a/translated_images/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.nl.jpg b/translated_images/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.nl.jpg
new file mode 100644
index 00000000..80f9a477
Binary files /dev/null and b/translated_images/bad-chart-3.e201e2e915a230bc2cde289110604ec9abeb89be510bd82665bebc1228258972.nl.jpg differ
diff --git a/translated_images/bad-chart-4.68cfdf4011b454471053ee1231172747e1fbec2403b4443567f1dc678134f4f2.he.jpg b/translated_images/bad-chart-4.68cfdf4011b454471053ee1231172747e1fbec2403b4443567f1dc678134f4f2.he.jpg
new file mode 100644
index 00000000..b3867ec0
Binary files /dev/null and b/translated_images/bad-chart-4.68cfdf4011b454471053ee1231172747e1fbec2403b4443567f1dc678134f4f2.he.jpg differ
diff --git a/translated_images/bad-chart-4.68cfdf4011b454471053ee1231172747e1fbec2403b4443567f1dc678134f4f2.nl.jpg b/translated_images/bad-chart-4.68cfdf4011b454471053ee1231172747e1fbec2403b4443567f1dc678134f4f2.nl.jpg
new file mode 100644
index 00000000..5b1a1691
Binary files /dev/null and b/translated_images/bad-chart-4.68cfdf4011b454471053ee1231172747e1fbec2403b4443567f1dc678134f4f2.nl.jpg differ
diff --git a/translated_images/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.he.jpg b/translated_images/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.he.jpg
new file mode 100644
index 00000000..2bac3457
Binary files /dev/null and b/translated_images/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.he.jpg differ
diff --git a/translated_images/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.nl.jpg b/translated_images/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.nl.jpg
new file mode 100644
index 00000000..621ba21d
Binary files /dev/null and b/translated_images/bad-chart-4.8872b2b881ffa96c3e0db10eb6aed7793efae2cac382c53932794260f7bfff07.nl.jpg differ
diff --git a/translated_images/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.he.jpg b/translated_images/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.he.jpg
new file mode 100644
index 00000000..032326e9
Binary files /dev/null and b/translated_images/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.he.jpg differ
diff --git a/translated_images/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.nl.jpg b/translated_images/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.nl.jpg
new file mode 100644
index 00000000..032326e9
Binary files /dev/null and b/translated_images/bee.0aa1d91132b12e3a8994b9ca12816d05ce1642010d9b8be37f8d37365ba845cf.nl.jpg differ
diff --git a/translated_images/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.he.png b/translated_images/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.he.png
new file mode 100644
index 00000000..ec977685
Binary files /dev/null and b/translated_images/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.he.png differ
diff --git a/translated_images/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.nl.png b/translated_images/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.nl.png
new file mode 100644
index 00000000..6670fa05
Binary files /dev/null and b/translated_images/bodymass-per-order.9d2b065dd931b928c839d8cdbee63067ab1ae52218a1b90717f4bc744354f485.nl.png differ
diff --git a/translated_images/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.he.png b/translated_images/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.he.png
new file mode 100644
index 00000000..9ab40265
Binary files /dev/null and b/translated_images/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.he.png differ
diff --git a/translated_images/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.nl.png b/translated_images/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.nl.png
new file mode 100644
index 00000000..bfcf7f98
Binary files /dev/null and b/translated_images/bodymass-smooth.d31ce526d82b0a1f19a073815dea28ecfbe58145ec5337e4ef7e8cdac81120b3.nl.png differ
diff --git a/translated_images/boxplot_byrole.036b27a1c3f52d42f66fba2324ec5cde0a1bca6a01a619eeb0ce7cd054b2527b.he.png b/translated_images/boxplot_byrole.036b27a1c3f52d42f66fba2324ec5cde0a1bca6a01a619eeb0ce7cd054b2527b.he.png
new file mode 100644
index 00000000..fa16c14d
Binary files /dev/null and b/translated_images/boxplot_byrole.036b27a1c3f52d42f66fba2324ec5cde0a1bca6a01a619eeb0ce7cd054b2527b.he.png differ
diff --git a/translated_images/boxplot_byrole.036b27a1c3f52d42f66fba2324ec5cde0a1bca6a01a619eeb0ce7cd054b2527b.nl.png b/translated_images/boxplot_byrole.036b27a1c3f52d42f66fba2324ec5cde0a1bca6a01a619eeb0ce7cd054b2527b.nl.png
new file mode 100644
index 00000000..99f0c5e5
Binary files /dev/null and b/translated_images/boxplot_byrole.036b27a1c3f52d42f66fba2324ec5cde0a1bca6a01a619eeb0ce7cd054b2527b.nl.png differ
diff --git a/translated_images/boxplot_explanation.4039b7de08780fd493ef798b41f7291d753f1f84de8955645f00c586e65f16a3.he.png b/translated_images/boxplot_explanation.4039b7de08780fd493ef798b41f7291d753f1f84de8955645f00c586e65f16a3.he.png
new file mode 100644
index 00000000..46bf36ad
Binary files /dev/null and b/translated_images/boxplot_explanation.4039b7de08780fd493ef798b41f7291d753f1f84de8955645f00c586e65f16a3.he.png differ
diff --git a/translated_images/boxplot_explanation.4039b7de08780fd493ef798b41f7291d753f1f84de8955645f00c586e65f16a3.nl.png b/translated_images/boxplot_explanation.4039b7de08780fd493ef798b41f7291d753f1f84de8955645f00c586e65f16a3.nl.png
new file mode 100644
index 00000000..58d6f2df
Binary files /dev/null and b/translated_images/boxplot_explanation.4039b7de08780fd493ef798b41f7291d753f1f84de8955645f00c586e65f16a3.nl.png differ
diff --git a/translated_images/busing.7b9e3b41cd4b981c6d63922cd82004cc1cf18895155536c1d98fcc0999bdd23e.he.png b/translated_images/busing.7b9e3b41cd4b981c6d63922cd82004cc1cf18895155536c1d98fcc0999bdd23e.he.png
new file mode 100644
index 00000000..617748a3
Binary files /dev/null and b/translated_images/busing.7b9e3b41cd4b981c6d63922cd82004cc1cf18895155536c1d98fcc0999bdd23e.he.png differ
diff --git a/translated_images/busing.7b9e3b41cd4b981c6d63922cd82004cc1cf18895155536c1d98fcc0999bdd23e.nl.png b/translated_images/busing.7b9e3b41cd4b981c6d63922cd82004cc1cf18895155536c1d98fcc0999bdd23e.nl.png
new file mode 100644
index 00000000..22bfda63
Binary files /dev/null and b/translated_images/busing.7b9e3b41cd4b981c6d63922cd82004cc1cf18895155536c1d98fcc0999bdd23e.nl.png differ
diff --git a/translated_images/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.he.png b/translated_images/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.he.png
new file mode 100644
index 00000000..68f1ff88
Binary files /dev/null and b/translated_images/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.he.png differ
diff --git a/translated_images/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.nl.png b/translated_images/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.nl.png
new file mode 100644
index 00000000..22bfda63
Binary files /dev/null and b/translated_images/busing.8157cf1bc89a3f65052d362a78c72f964982ceb9dcacbe44480e35909c3dce62.nl.png differ
diff --git a/translated_images/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.he.png b/translated_images/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.he.png
new file mode 100644
index 00000000..dd80b721
Binary files /dev/null and b/translated_images/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.he.png differ
diff --git a/translated_images/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.nl.png b/translated_images/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.nl.png
new file mode 100644
index 00000000..670264d3
Binary files /dev/null and b/translated_images/category-counts-02.0b9a0a4de42275ae5096d0f8da590d8bf520d9e7e40aad5cc4fc8d276480cc32.nl.png differ
diff --git a/translated_images/category-counts.abee8188c4c9b6f0b4e13e2920039c9fa5cc151031a5c28e5a5ff6fb8c072ab4.he.png b/translated_images/category-counts.abee8188c4c9b6f0b4e13e2920039c9fa5cc151031a5c28e5a5ff6fb8c072ab4.he.png
new file mode 100644
index 00000000..6132710f
Binary files /dev/null and b/translated_images/category-counts.abee8188c4c9b6f0b4e13e2920039c9fa5cc151031a5c28e5a5ff6fb8c072ab4.he.png differ
diff --git a/translated_images/category-counts.abee8188c4c9b6f0b4e13e2920039c9fa5cc151031a5c28e5a5ff6fb8c072ab4.nl.png b/translated_images/category-counts.abee8188c4c9b6f0b4e13e2920039c9fa5cc151031a5c28e5a5ff6fb8c072ab4.nl.png
new file mode 100644
index 00000000..6132710f
Binary files /dev/null and b/translated_images/category-counts.abee8188c4c9b6f0b4e13e2920039c9fa5cc151031a5c28e5a5ff6fb8c072ab4.nl.png differ
diff --git a/translated_images/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.he.png b/translated_images/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.he.png
new file mode 100644
index 00000000..b7152725
Binary files /dev/null and b/translated_images/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.he.png differ
diff --git a/translated_images/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.nl.png b/translated_images/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.nl.png
new file mode 100644
index 00000000..6620a350
Binary files /dev/null and b/translated_images/category-length-02.7304bf519375c9807d8165cc7ec60dd2a60f7b365b23098538e287d89adb7d76.nl.png differ
diff --git a/translated_images/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.he.png b/translated_images/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.he.png
new file mode 100644
index 00000000..5a295d28
Binary files /dev/null and b/translated_images/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.he.png differ
diff --git a/translated_images/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.nl.png b/translated_images/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.nl.png
new file mode 100644
index 00000000..3674ba2f
Binary files /dev/null and b/translated_images/category-length.7e34c296690e85d64f7e4d25a56077442683eca96c4f5b4eae120a64c0755636.nl.png differ
diff --git a/translated_images/category-length.b0d9a0208a7b37136bed52d3abd90190543fbca94bde6f51652313cc6d017187.he.png b/translated_images/category-length.b0d9a0208a7b37136bed52d3abd90190543fbca94bde6f51652313cc6d017187.he.png
new file mode 100644
index 00000000..bea2b83a
Binary files /dev/null and b/translated_images/category-length.b0d9a0208a7b37136bed52d3abd90190543fbca94bde6f51652313cc6d017187.he.png differ
diff --git a/translated_images/category-length.b0d9a0208a7b37136bed52d3abd90190543fbca94bde6f51652313cc6d017187.nl.png b/translated_images/category-length.b0d9a0208a7b37136bed52d3abd90190543fbca94bde6f51652313cc6d017187.nl.png
new file mode 100644
index 00000000..bea2b83a
Binary files /dev/null and b/translated_images/category-length.b0d9a0208a7b37136bed52d3abd90190543fbca94bde6f51652313cc6d017187.nl.png differ
diff --git a/translated_images/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.he.jpg b/translated_images/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.he.jpg
new file mode 100644
index 00000000..30a2ba6e
Binary files /dev/null and b/translated_images/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.he.jpg differ
diff --git a/translated_images/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.nl.jpg b/translated_images/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.nl.jpg
new file mode 100644
index 00000000..30a2ba6e
Binary files /dev/null and b/translated_images/cloud-picture.f5526de3c6c6387b2d656ba94f019b3352e5e3854a78440e4fb00c93e2dea675.nl.jpg differ
diff --git a/translated_images/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.he.png b/translated_images/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.he.png
new file mode 100644
index 00000000..c47d4387
Binary files /dev/null and b/translated_images/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.he.png differ
diff --git a/translated_images/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.nl.png b/translated_images/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.nl.png
new file mode 100644
index 00000000..a07ba23b
Binary files /dev/null and b/translated_images/cluster-1.b78cb630bb543729b11f60c34d97110a263f8c27b516ba4dc47807b3cee5579f.nl.png differ
diff --git a/translated_images/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.he.png b/translated_images/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.he.png
new file mode 100644
index 00000000..5b04ba51
Binary files /dev/null and b/translated_images/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.he.png differ
diff --git a/translated_images/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.nl.png b/translated_images/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.nl.png
new file mode 100644
index 00000000..4102635e
Binary files /dev/null and b/translated_images/cluster-2.ea30cdbc9f926bb9e05af3fdbc1f679811c796dc2a6847f935290aec15526e88.nl.png differ
diff --git a/translated_images/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.he.png b/translated_images/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.he.png
new file mode 100644
index 00000000..86782093
Binary files /dev/null and b/translated_images/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.he.png differ
diff --git a/translated_images/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.nl.png b/translated_images/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.nl.png
new file mode 100644
index 00000000..8cd8b6e0
Binary files /dev/null and b/translated_images/cluster-3.8a334bc070ec173a329ce5abd2a9d727542e83eb2347676c9af20f2c8870b3e7.nl.png differ
diff --git a/translated_images/columnar-db.ffcfe73c3e9063a8c8f93f8ace85e1200863584b1e324eb5159d8ca10f62ec04.he.png b/translated_images/columnar-db.ffcfe73c3e9063a8c8f93f8ace85e1200863584b1e324eb5159d8ca10f62ec04.he.png
new file mode 100644
index 00000000..59fb3007
Binary files /dev/null and b/translated_images/columnar-db.ffcfe73c3e9063a8c8f93f8ace85e1200863584b1e324eb5159d8ca10f62ec04.he.png differ
diff --git a/translated_images/columnar-db.ffcfe73c3e9063a8c8f93f8ace85e1200863584b1e324eb5159d8ca10f62ec04.nl.png b/translated_images/columnar-db.ffcfe73c3e9063a8c8f93f8ace85e1200863584b1e324eb5159d8ca10f62ec04.nl.png
new file mode 100644
index 00000000..2be01d43
Binary files /dev/null and b/translated_images/columnar-db.ffcfe73c3e9063a8c8f93f8ace85e1200863584b1e324eb5159d8ca10f62ec04.nl.png differ
diff --git a/translated_images/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.he.jpg b/translated_images/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.he.jpg
new file mode 100644
index 00000000..c695118a
Binary files /dev/null and b/translated_images/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.he.jpg differ
diff --git a/translated_images/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.nl.jpg b/translated_images/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.nl.jpg
new file mode 100644
index 00000000..59186b72
Binary files /dev/null and b/translated_images/communication.06d8e2a88d30d168d661ad9f9f0a4f947ebff3719719cfdaf9ed00a406a01ead.nl.jpg differ
diff --git a/translated_images/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.he.png b/translated_images/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.he.png
new file mode 100644
index 00000000..6c162097
Binary files /dev/null and b/translated_images/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.he.png differ
diff --git a/translated_images/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.nl.png b/translated_images/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.nl.png
new file mode 100644
index 00000000..29b278b7
Binary files /dev/null and b/translated_images/comparingdata.f486a450d61c7ca5416f27f3f55a6a4465d00df3be5e6d33936e9b07b95e2fdd.nl.png differ
diff --git a/translated_images/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.he.png b/translated_images/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.he.png
new file mode 100644
index 00000000..1bbe7bd2
Binary files /dev/null and b/translated_images/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.he.png differ
diff --git a/translated_images/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.nl.png b/translated_images/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.nl.png
new file mode 100644
index 00000000..2cb72556
Binary files /dev/null and b/translated_images/compute-instance-1.dba347cb199ca4996b3e3d649295ed95626ba481479d3986557b9b98e76d8816.nl.png differ
diff --git a/translated_images/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.he.png b/translated_images/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.he.png
new file mode 100644
index 00000000..94a2ba9d
Binary files /dev/null and b/translated_images/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.he.png differ
diff --git a/translated_images/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.nl.png b/translated_images/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.nl.png
new file mode 100644
index 00000000..763ab9e1
Binary files /dev/null and b/translated_images/consumption-1.700abd196452842a020c7d745908637a6e4c5c50494ad1217be80e283e0de154.nl.png differ
diff --git a/translated_images/cosmosdb-emulator-explorer.a1c80b1347206fe2f30f88fc123821636587d04fc5a56a9eb350c7da6b31f361.he.png b/translated_images/cosmosdb-emulator-explorer.a1c80b1347206fe2f30f88fc123821636587d04fc5a56a9eb350c7da6b31f361.he.png
new file mode 100644
index 00000000..29975d09
Binary files /dev/null and b/translated_images/cosmosdb-emulator-explorer.a1c80b1347206fe2f30f88fc123821636587d04fc5a56a9eb350c7da6b31f361.he.png differ
diff --git a/translated_images/cosmosdb-emulator-explorer.a1c80b1347206fe2f30f88fc123821636587d04fc5a56a9eb350c7da6b31f361.nl.png b/translated_images/cosmosdb-emulator-explorer.a1c80b1347206fe2f30f88fc123821636587d04fc5a56a9eb350c7da6b31f361.nl.png
new file mode 100644
index 00000000..07bf0b76
Binary files /dev/null and b/translated_images/cosmosdb-emulator-explorer.a1c80b1347206fe2f30f88fc123821636587d04fc5a56a9eb350c7da6b31f361.nl.png differ
diff --git a/translated_images/cosmosdb-emulator-persons-query.6905ebb497e3cd047cd96e55a0a03f69ce1b91b2b3d8c147e617b746b22b7e33.he.png b/translated_images/cosmosdb-emulator-persons-query.6905ebb497e3cd047cd96e55a0a03f69ce1b91b2b3d8c147e617b746b22b7e33.he.png
new file mode 100644
index 00000000..885b896a
Binary files /dev/null and b/translated_images/cosmosdb-emulator-persons-query.6905ebb497e3cd047cd96e55a0a03f69ce1b91b2b3d8c147e617b746b22b7e33.he.png differ
diff --git a/translated_images/cosmosdb-emulator-persons-query.6905ebb497e3cd047cd96e55a0a03f69ce1b91b2b3d8c147e617b746b22b7e33.nl.png b/translated_images/cosmosdb-emulator-persons-query.6905ebb497e3cd047cd96e55a0a03f69ce1b91b2b3d8c147e617b746b22b7e33.nl.png
new file mode 100644
index 00000000..2ac5eb31
Binary files /dev/null and b/translated_images/cosmosdb-emulator-persons-query.6905ebb497e3cd047cd96e55a0a03f69ce1b91b2b3d8c147e617b746b22b7e33.nl.png differ
diff --git a/translated_images/cosmosdb-emulator-persons.bf640586a7077c8985dfd3071946465c8e074c722c7c202d6d714de99a93b90a.he.png b/translated_images/cosmosdb-emulator-persons.bf640586a7077c8985dfd3071946465c8e074c722c7c202d6d714de99a93b90a.he.png
new file mode 100644
index 00000000..82e3454f
Binary files /dev/null and b/translated_images/cosmosdb-emulator-persons.bf640586a7077c8985dfd3071946465c8e074c722c7c202d6d714de99a93b90a.he.png differ
diff --git a/translated_images/cosmosdb-emulator-persons.bf640586a7077c8985dfd3071946465c8e074c722c7c202d6d714de99a93b90a.nl.png b/translated_images/cosmosdb-emulator-persons.bf640586a7077c8985dfd3071946465c8e074c722c7c202d6d714de99a93b90a.nl.png
new file mode 100644
index 00000000..daf3dba2
Binary files /dev/null and b/translated_images/cosmosdb-emulator-persons.bf640586a7077c8985dfd3071946465c8e074c722c7c202d6d714de99a93b90a.nl.png differ
diff --git a/translated_images/covidspread.f3d131c4f1d260ab0344d79bac0abe7924598dd754859b165955772e1bd5e8a2.he.png b/translated_images/covidspread.f3d131c4f1d260ab0344d79bac0abe7924598dd754859b165955772e1bd5e8a2.he.png
new file mode 100644
index 00000000..2a4aa494
Binary files /dev/null and b/translated_images/covidspread.f3d131c4f1d260ab0344d79bac0abe7924598dd754859b165955772e1bd5e8a2.he.png differ
diff --git a/translated_images/covidspread.f3d131c4f1d260ab0344d79bac0abe7924598dd754859b165955772e1bd5e8a2.nl.png b/translated_images/covidspread.f3d131c4f1d260ab0344d79bac0abe7924598dd754859b165955772e1bd5e8a2.nl.png
new file mode 100644
index 00000000..851e25ad
Binary files /dev/null and b/translated_images/covidspread.f3d131c4f1d260ab0344d79bac0abe7924598dd754859b165955772e1bd5e8a2.nl.png differ
diff --git a/translated_images/covidtreat.b2ba59f57ca45fbcda36e0ddca3f8cfdddeeed6ca879ea7f866d93fa6ec65791.he.png b/translated_images/covidtreat.b2ba59f57ca45fbcda36e0ddca3f8cfdddeeed6ca879ea7f866d93fa6ec65791.he.png
new file mode 100644
index 00000000..7a00c531
Binary files /dev/null and b/translated_images/covidtreat.b2ba59f57ca45fbcda36e0ddca3f8cfdddeeed6ca879ea7f866d93fa6ec65791.he.png differ
diff --git a/translated_images/covidtreat.b2ba59f57ca45fbcda36e0ddca3f8cfdddeeed6ca879ea7f866d93fa6ec65791.nl.png b/translated_images/covidtreat.b2ba59f57ca45fbcda36e0ddca3f8cfdddeeed6ca879ea7f866d93fa6ec65791.nl.png
new file mode 100644
index 00000000..7349fcdf
Binary files /dev/null and b/translated_images/covidtreat.b2ba59f57ca45fbcda36e0ddca3f8cfdddeeed6ca879ea7f866d93fa6ec65791.nl.png differ
diff --git a/translated_images/data-love.a22ef29e6742c852505ada062920956d3d7604870b281a8ca7c7ac6f37381d5a.he.jpg b/translated_images/data-love.a22ef29e6742c852505ada062920956d3d7604870b281a8ca7c7ac6f37381d5a.he.jpg
new file mode 100644
index 00000000..4d0273dc
Binary files /dev/null and b/translated_images/data-love.a22ef29e6742c852505ada062920956d3d7604870b281a8ca7c7ac6f37381d5a.he.jpg differ
diff --git a/translated_images/data-love.a22ef29e6742c852505ada062920956d3d7604870b281a8ca7c7ac6f37381d5a.nl.jpg b/translated_images/data-love.a22ef29e6742c852505ada062920956d3d7604870b281a8ca7c7ac6f37381d5a.nl.jpg
new file mode 100644
index 00000000..54145b36
Binary files /dev/null and b/translated_images/data-love.a22ef29e6742c852505ada062920956d3d7604870b281a8ca7c7ac6f37381d5a.nl.jpg differ
diff --git a/translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.he.png b/translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.he.png
new file mode 100644
index 00000000..bf12c4d3
Binary files /dev/null and b/translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.he.png differ
diff --git a/translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.nl.png b/translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.nl.png
new file mode 100644
index 00000000..31b399ae
Binary files /dev/null and b/translated_images/data-science-applications.4e5019cd8790ebac2277ff5f08af386f8727cac5d30f77727c7090677e6adb9c.nl.png differ
diff --git a/translated_images/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.he.jpg b/translated_images/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.he.jpg
new file mode 100644
index 00000000..e47fdddc
Binary files /dev/null and b/translated_images/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.he.jpg differ
diff --git a/translated_images/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.nl.jpg b/translated_images/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.nl.jpg
new file mode 100644
index 00000000..f023057b
Binary files /dev/null and b/translated_images/data-science-lifecycle.a1e362637503c4fb0cd5e859d7552edcdb4aa629a279727008baa121f2d33f32.nl.jpg differ
diff --git a/translated_images/data.48e22bb7617d8d92188afbc4c48effb920ba79f5cebdc0652cd9f34bbbd90c18.he.jpg b/translated_images/data.48e22bb7617d8d92188afbc4c48effb920ba79f5cebdc0652cd9f34bbbd90c18.he.jpg
new file mode 100644
index 00000000..bd6a8414
Binary files /dev/null and b/translated_images/data.48e22bb7617d8d92188afbc4c48effb920ba79f5cebdc0652cd9f34bbbd90c18.he.jpg differ
diff --git a/translated_images/data.48e22bb7617d8d92188afbc4c48effb920ba79f5cebdc0652cd9f34bbbd90c18.nl.jpg b/translated_images/data.48e22bb7617d8d92188afbc4c48effb920ba79f5cebdc0652cd9f34bbbd90c18.nl.jpg
new file mode 100644
index 00000000..3ffe2c3e
Binary files /dev/null and b/translated_images/data.48e22bb7617d8d92188afbc4c48effb920ba79f5cebdc0652cd9f34bbbd90c18.nl.jpg differ
diff --git a/translated_images/dataframe-1.caf409f0c688e84c85b793998b945f3cb66554e13dbb490d4a52f37909a41eb4.he.png b/translated_images/dataframe-1.caf409f0c688e84c85b793998b945f3cb66554e13dbb490d4a52f37909a41eb4.he.png
new file mode 100644
index 00000000..ee11deb5
Binary files /dev/null and b/translated_images/dataframe-1.caf409f0c688e84c85b793998b945f3cb66554e13dbb490d4a52f37909a41eb4.he.png differ
diff --git a/translated_images/dataframe-1.caf409f0c688e84c85b793998b945f3cb66554e13dbb490d4a52f37909a41eb4.nl.png b/translated_images/dataframe-1.caf409f0c688e84c85b793998b945f3cb66554e13dbb490d4a52f37909a41eb4.nl.png
new file mode 100644
index 00000000..c8856d6f
Binary files /dev/null and b/translated_images/dataframe-1.caf409f0c688e84c85b793998b945f3cb66554e13dbb490d4a52f37909a41eb4.nl.png differ
diff --git a/translated_images/datascienceinthecloud.59ffb059a670fb0a68fee3f0f2906239b25240a57c3990b8c0809c9c7703eabd.he.jpg b/translated_images/datascienceinthecloud.59ffb059a670fb0a68fee3f0f2906239b25240a57c3990b8c0809c9c7703eabd.he.jpg
new file mode 100644
index 00000000..524f2f53
Binary files /dev/null and b/translated_images/datascienceinthecloud.59ffb059a670fb0a68fee3f0f2906239b25240a57c3990b8c0809c9c7703eabd.he.jpg differ
diff --git a/translated_images/datascienceinthecloud.59ffb059a670fb0a68fee3f0f2906239b25240a57c3990b8c0809c9c7703eabd.nl.jpg b/translated_images/datascienceinthecloud.59ffb059a670fb0a68fee3f0f2906239b25240a57c3990b8c0809c9c7703eabd.nl.jpg
new file mode 100644
index 00000000..e2d52b84
Binary files /dev/null and b/translated_images/datascienceinthecloud.59ffb059a670fb0a68fee3f0f2906239b25240a57c3990b8c0809c9c7703eabd.nl.jpg differ
diff --git a/translated_images/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.he.png b/translated_images/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.he.png
new file mode 100644
index 00000000..c8bfe206
Binary files /dev/null and b/translated_images/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.he.png differ
diff --git a/translated_images/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.nl.png b/translated_images/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.nl.png
new file mode 100644
index 00000000..90a248c5
Binary files /dev/null and b/translated_images/dataset-1.e86ab4e10907a6e9c2a72577b51db35f13689cb33702337b8b7032f2ef76dac2.nl.png differ
diff --git a/translated_images/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.he.png b/translated_images/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.he.png
new file mode 100644
index 00000000..6435f733
Binary files /dev/null and b/translated_images/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.he.png differ
diff --git a/translated_images/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.nl.png b/translated_images/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.nl.png
new file mode 100644
index 00000000..08f6f872
Binary files /dev/null and b/translated_images/dataset-2.f58de1c435d5bf9ccb16ccc5f5d4380eb2b50affca85cfbf4f97562bdab99f77.nl.png differ
diff --git a/translated_images/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.he.png b/translated_images/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.he.png
new file mode 100644
index 00000000..07a69d32
Binary files /dev/null and b/translated_images/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.he.png differ
diff --git a/translated_images/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.nl.png b/translated_images/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.nl.png
new file mode 100644
index 00000000..a95d35ed
Binary files /dev/null and b/translated_images/dataset-3.58db8c0eb783e89236a02bbce5bb4ba808d081a87d994d5284b1ae59928c95bf.nl.png differ
diff --git a/translated_images/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.he.png b/translated_images/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.he.png
new file mode 100644
index 00000000..f3f19d69
Binary files /dev/null and b/translated_images/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.he.png differ
diff --git a/translated_images/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.nl.png b/translated_images/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.nl.png
new file mode 100644
index 00000000..05bd7cfb
Binary files /dev/null and b/translated_images/density-plot.675ccf865b76c690487fb7f69420a8444a3515f03bad5482886232d4330f5c85.nl.png differ
diff --git a/translated_images/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.he.png b/translated_images/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.he.png
new file mode 100644
index 00000000..7ae7bb11
Binary files /dev/null and b/translated_images/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.he.png differ
diff --git a/translated_images/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.nl.png b/translated_images/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.nl.png
new file mode 100644
index 00000000..c0380466
Binary files /dev/null and b/translated_images/density1.8801043bd4af2567b0f706332b5853c7614e5e4b81b457acc27eb4e092a65cbd.nl.png differ
diff --git a/translated_images/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.he.png b/translated_images/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.he.png
new file mode 100644
index 00000000..6733b9eb
Binary files /dev/null and b/translated_images/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.he.png differ
diff --git a/translated_images/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.nl.png b/translated_images/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.nl.png
new file mode 100644
index 00000000..1f336817
Binary files /dev/null and b/translated_images/density2.8e7647257060ff544a1aaded57e8dd1887586bfe340139e9b77ac1e5287f7977.nl.png differ
diff --git a/translated_images/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.he.png b/translated_images/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.he.png
new file mode 100644
index 00000000..0c6dcaa1
Binary files /dev/null and b/translated_images/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.he.png differ
diff --git a/translated_images/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.nl.png b/translated_images/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.nl.png
new file mode 100644
index 00000000..29d3155b
Binary files /dev/null and b/translated_images/density3.84ae27da82f31e6b83ad977646f029a1d21186574d7581facd70123b3eb257ee.nl.png differ
diff --git a/translated_images/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.he.png b/translated_images/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.he.png
new file mode 100644
index 00000000..205f579e
Binary files /dev/null and b/translated_images/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.he.png differ
diff --git a/translated_images/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.nl.png b/translated_images/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.nl.png
new file mode 100644
index 00000000..8d88bddf
Binary files /dev/null and b/translated_images/density4.e9d6c033f15c500fd33df94cb592b9f5cf1ed2a3d213c448a3f9e97ba39573ce.nl.png differ
diff --git a/translated_images/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.he.png b/translated_images/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.he.png
new file mode 100644
index 00000000..9e8f3829
Binary files /dev/null and b/translated_images/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.he.png differ
diff --git a/translated_images/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.nl.png b/translated_images/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.nl.png
new file mode 100644
index 00000000..7bbb3825
Binary files /dev/null and b/translated_images/deploy-1.ddad725acadc84e34553c3d09e727160faeb32527a9fb8b904c0f99235a34bb6.nl.png differ
diff --git a/translated_images/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.he.png b/translated_images/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.he.png
new file mode 100644
index 00000000..f1142b18
Binary files /dev/null and b/translated_images/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.he.png differ
diff --git a/translated_images/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.nl.png b/translated_images/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.nl.png
new file mode 100644
index 00000000..453a3713
Binary files /dev/null and b/translated_images/deploy-2.94dbb13f239086473aa4bf814342fd40483d136849b080f02bafbb995383940e.nl.png differ
diff --git a/translated_images/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.he.png b/translated_images/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.he.png
new file mode 100644
index 00000000..1bbbe867
Binary files /dev/null and b/translated_images/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.he.png differ
diff --git a/translated_images/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.nl.png b/translated_images/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.nl.png
new file mode 100644
index 00000000..256ad14c
Binary files /dev/null and b/translated_images/deploy-3.fecefef070e8ef3b28e802326d107f61ac4e672d20bf82d05f78d025f9e6c611.nl.png differ
diff --git a/translated_images/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.he.png b/translated_images/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.he.png
new file mode 100644
index 00000000..2a860222
Binary files /dev/null and b/translated_images/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.he.png differ
diff --git a/translated_images/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.nl.png b/translated_images/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.nl.png
new file mode 100644
index 00000000..be6b5458
Binary files /dev/null and b/translated_images/dist1-wb.0d0cac82e2974fbbec635826fefead401af795f82e2279e2e2678bf2c117d827.nl.png differ
diff --git a/translated_images/dist1.0010100b00231819be7540ba60a4909cbda8a1a83c1cc1ceb4d4e8a5bcb325f4.he.png b/translated_images/dist1.0010100b00231819be7540ba60a4909cbda8a1a83c1cc1ceb4d4e8a5bcb325f4.he.png
new file mode 100644
index 00000000..ccc99767
Binary files /dev/null and b/translated_images/dist1.0010100b00231819be7540ba60a4909cbda8a1a83c1cc1ceb4d4e8a5bcb325f4.he.png differ
diff --git a/translated_images/dist1.0010100b00231819be7540ba60a4909cbda8a1a83c1cc1ceb4d4e8a5bcb325f4.nl.png b/translated_images/dist1.0010100b00231819be7540ba60a4909cbda8a1a83c1cc1ceb4d4e8a5bcb325f4.nl.png
new file mode 100644
index 00000000..ccc99767
Binary files /dev/null and b/translated_images/dist1.0010100b00231819be7540ba60a4909cbda8a1a83c1cc1ceb4d4e8a5bcb325f4.nl.png differ
diff --git a/translated_images/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.he.png b/translated_images/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.he.png
new file mode 100644
index 00000000..88780c10
Binary files /dev/null and b/translated_images/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.he.png differ
diff --git a/translated_images/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.nl.png b/translated_images/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.nl.png
new file mode 100644
index 00000000..7da33268
Binary files /dev/null and b/translated_images/dist2-wb.2c0a7a3499b2fbf561e9f93b69f265dfc538dc78f6de15088ba84a88152e26ba.nl.png differ
diff --git a/translated_images/dist2.c398bfd5320401b924305d2cc20a6c0f6670455e61abaf827a359d07b4248969.he.png b/translated_images/dist2.c398bfd5320401b924305d2cc20a6c0f6670455e61abaf827a359d07b4248969.he.png
new file mode 100644
index 00000000..f2d0f317
Binary files /dev/null and b/translated_images/dist2.c398bfd5320401b924305d2cc20a6c0f6670455e61abaf827a359d07b4248969.he.png differ
diff --git a/translated_images/dist2.c398bfd5320401b924305d2cc20a6c0f6670455e61abaf827a359d07b4248969.nl.png b/translated_images/dist2.c398bfd5320401b924305d2cc20a6c0f6670455e61abaf827a359d07b4248969.nl.png
new file mode 100644
index 00000000..f2d0f317
Binary files /dev/null and b/translated_images/dist2.c398bfd5320401b924305d2cc20a6c0f6670455e61abaf827a359d07b4248969.nl.png differ
diff --git a/translated_images/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.he.png b/translated_images/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.he.png
new file mode 100644
index 00000000..5c287fb7
Binary files /dev/null and b/translated_images/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.he.png differ
diff --git a/translated_images/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.nl.png b/translated_images/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.nl.png
new file mode 100644
index 00000000..261d64d4
Binary files /dev/null and b/translated_images/dist3-wb.64b88db7f9780200bd486a2c2a3252548dd439672dbd3f778193db7f654b100c.nl.png differ
diff --git a/translated_images/dist3.ad4d9658559690f561d0ac76bfee5843cce918f9c83805be66e0790ac824ef07.he.png b/translated_images/dist3.ad4d9658559690f561d0ac76bfee5843cce918f9c83805be66e0790ac824ef07.he.png
new file mode 100644
index 00000000..e48b0151
Binary files /dev/null and b/translated_images/dist3.ad4d9658559690f561d0ac76bfee5843cce918f9c83805be66e0790ac824ef07.he.png differ
diff --git a/translated_images/dist3.ad4d9658559690f561d0ac76bfee5843cce918f9c83805be66e0790ac824ef07.nl.png b/translated_images/dist3.ad4d9658559690f561d0ac76bfee5843cce918f9c83805be66e0790ac824ef07.nl.png
new file mode 100644
index 00000000..e48b0151
Binary files /dev/null and b/translated_images/dist3.ad4d9658559690f561d0ac76bfee5843cce918f9c83805be66e0790ac824ef07.nl.png differ
diff --git a/translated_images/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.he.png b/translated_images/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.he.png
new file mode 100644
index 00000000..ebbd0241
Binary files /dev/null and b/translated_images/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.he.png differ
diff --git a/translated_images/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.nl.png b/translated_images/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.nl.png
new file mode 100644
index 00000000..cd2de363
Binary files /dev/null and b/translated_images/distribution-30bins.6a3921ea7a421bf71f06bf5231009e43d1146f1b8da8dc254e99b5779a4983e5.nl.png differ
diff --git a/translated_images/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.he.png b/translated_images/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.he.png
new file mode 100644
index 00000000..f702f591
Binary files /dev/null and b/translated_images/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.he.png differ
diff --git a/translated_images/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.nl.png b/translated_images/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.nl.png
new file mode 100644
index 00000000..c2d7ee11
Binary files /dev/null and b/translated_images/distribution-over-the-entire-dataset.d22afd3fa96be854e4c82213fedec9e3703cba753d07fad4606aadf58cf7e78e.nl.png differ
diff --git a/translated_images/document-db.ddeec48c6dc9e5fd1c905a6de302537f57a2e74c82753baeaa27e992512282b9.he.png b/translated_images/document-db.ddeec48c6dc9e5fd1c905a6de302537f57a2e74c82753baeaa27e992512282b9.he.png
new file mode 100644
index 00000000..1eb61f27
Binary files /dev/null and b/translated_images/document-db.ddeec48c6dc9e5fd1c905a6de302537f57a2e74c82753baeaa27e992512282b9.he.png differ
diff --git a/translated_images/document-db.ddeec48c6dc9e5fd1c905a6de302537f57a2e74c82753baeaa27e992512282b9.nl.png b/translated_images/document-db.ddeec48c6dc9e5fd1c905a6de302537f57a2e74c82753baeaa27e992512282b9.nl.png
new file mode 100644
index 00000000..1f4edd2a
Binary files /dev/null and b/translated_images/document-db.ddeec48c6dc9e5fd1c905a6de302537f57a2e74c82753baeaa27e992512282b9.nl.png differ
diff --git a/translated_images/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.he.png b/translated_images/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.he.png
new file mode 100644
index 00000000..cdb28f96
Binary files /dev/null and b/translated_images/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.he.png differ
diff --git a/translated_images/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.nl.png b/translated_images/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.nl.png
new file mode 100644
index 00000000..d4a8fed7
Binary files /dev/null and b/translated_images/donut-wb.34e6fb275da9d834c2205145e39a3de9b6878191dcdba6f7a9e85f4b520449bc.nl.png differ
diff --git a/translated_images/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.he.png b/translated_images/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.he.png
new file mode 100644
index 00000000..10d57c66
Binary files /dev/null and b/translated_images/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.he.png differ
diff --git a/translated_images/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.nl.png b/translated_images/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.nl.png
new file mode 100644
index 00000000..5601a5f3
Binary files /dev/null and b/translated_images/donut-wb.be3c12a22712302b5d10c40014d5389d4a1ae4412fe1655b3cf4af57b64f799a.nl.png differ
diff --git a/translated_images/donut.f016d7be7f08c8f8c49e9217b2ee05e952ecd1bd8c6f5c49466080f4991ad790.he.png b/translated_images/donut.f016d7be7f08c8f8c49e9217b2ee05e952ecd1bd8c6f5c49466080f4991ad790.he.png
new file mode 100644
index 00000000..45a81049
Binary files /dev/null and b/translated_images/donut.f016d7be7f08c8f8c49e9217b2ee05e952ecd1bd8c6f5c49466080f4991ad790.he.png differ
diff --git a/translated_images/donut.f016d7be7f08c8f8c49e9217b2ee05e952ecd1bd8c6f5c49466080f4991ad790.nl.png b/translated_images/donut.f016d7be7f08c8f8c49e9217b2ee05e952ecd1bd8c6f5c49466080f4991ad790.nl.png
new file mode 100644
index 00000000..e109b4c9
Binary files /dev/null and b/translated_images/donut.f016d7be7f08c8f8c49e9217b2ee05e952ecd1bd8c6f5c49466080f4991ad790.nl.png differ
diff --git a/translated_images/ds-for-beginners.d01930c9193ef5228caf620d5462a4189dc1a551e34d121eb777e0463889d7a5.he.png b/translated_images/ds-for-beginners.d01930c9193ef5228caf620d5462a4189dc1a551e34d121eb777e0463889d7a5.he.png
new file mode 100644
index 00000000..94e2c83d
Binary files /dev/null and b/translated_images/ds-for-beginners.d01930c9193ef5228caf620d5462a4189dc1a551e34d121eb777e0463889d7a5.he.png differ
diff --git a/translated_images/ds-for-beginners.d01930c9193ef5228caf620d5462a4189dc1a551e34d121eb777e0463889d7a5.nl.png b/translated_images/ds-for-beginners.d01930c9193ef5228caf620d5462a4189dc1a551e34d121eb777e0463889d7a5.nl.png
new file mode 100644
index 00000000..eca904f2
Binary files /dev/null and b/translated_images/ds-for-beginners.d01930c9193ef5228caf620d5462a4189dc1a551e34d121eb777e0463889d7a5.nl.png differ
diff --git a/translated_images/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.he.png b/translated_images/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.he.png
new file mode 100644
index 00000000..9c411c9f
Binary files /dev/null and b/translated_images/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.he.png differ
diff --git a/translated_images/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.nl.png b/translated_images/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.nl.png
new file mode 100644
index 00000000..7a997271
Binary files /dev/null and b/translated_images/ds_wordcloud.664a7c07dca57de017c22bf0498cb40f898d48aa85b3c36a80620fea12fadd42.nl.png differ
diff --git a/translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.he.png b/translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.he.png
new file mode 100644
index 00000000..884e047e
Binary files /dev/null and b/translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.he.png differ
diff --git a/translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.nl.png b/translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.nl.png
new file mode 100644
index 00000000..e188772b
Binary files /dev/null and b/translated_images/dual-line.a4c28ce659603fab2c003f4df816733df2bf41d1facb7de27989ec9afbf01b33.nl.png differ
diff --git a/translated_images/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.he.png b/translated_images/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.he.png
new file mode 100644
index 00000000..81a17ff3
Binary files /dev/null and b/translated_images/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.he.png differ
diff --git a/translated_images/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.nl.png b/translated_images/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.nl.png
new file mode 100644
index 00000000..735037e7
Binary files /dev/null and b/translated_images/dual-line.fc4665f360a54018d7df9bc6abcc26460112e17dcbda18d3b9ae6109b32b36c3.nl.png differ
diff --git a/translated_images/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.he.png b/translated_images/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.he.png
new file mode 100644
index 00000000..d9edb164
Binary files /dev/null and b/translated_images/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.he.png differ
diff --git a/translated_images/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.nl.png b/translated_images/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.nl.png
new file mode 100644
index 00000000..9773f440
Binary files /dev/null and b/translated_images/facet.491ad90d61c2a7cc69b50c929f80786c749e38217ccedbf1e22ed8909b65987c.nl.png differ
diff --git a/translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.he.png b/translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.he.png
new file mode 100644
index 00000000..b33120f6
Binary files /dev/null and b/translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.he.png differ
diff --git a/translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.nl.png b/translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.nl.png
new file mode 100644
index 00000000..cc28c033
Binary files /dev/null and b/translated_images/facet.6a34851dcd540050dcc0ead741be35075d776741668dd0e42f482c89b114c217.nl.png differ
diff --git a/translated_images/favicon.37b561214b36d454f9fd1f725d77f310fe256eb88f2a0ae08b9cb18aeb30650c.he.png b/translated_images/favicon.37b561214b36d454f9fd1f725d77f310fe256eb88f2a0ae08b9cb18aeb30650c.he.png
new file mode 100644
index 00000000..26e0ae43
Binary files /dev/null and b/translated_images/favicon.37b561214b36d454f9fd1f725d77f310fe256eb88f2a0ae08b9cb18aeb30650c.he.png differ
diff --git a/translated_images/favicon.37b561214b36d454f9fd1f725d77f310fe256eb88f2a0ae08b9cb18aeb30650c.nl.png b/translated_images/favicon.37b561214b36d454f9fd1f725d77f310fe256eb88f2a0ae08b9cb18aeb30650c.nl.png
new file mode 100644
index 00000000..26e0ae43
Binary files /dev/null and b/translated_images/favicon.37b561214b36d454f9fd1f725d77f310fe256eb88f2a0ae08b9cb18aeb30650c.nl.png differ
diff --git a/translated_images/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.he.png b/translated_images/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.he.png
new file mode 100644
index 00000000..e35f0599
Binary files /dev/null and b/translated_images/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.he.png differ
diff --git a/translated_images/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.nl.png b/translated_images/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.nl.png
new file mode 100644
index 00000000..bafaf8f8
Binary files /dev/null and b/translated_images/filtered-histogram.6bf5d2bfd82533220e1bd4bc4f7d14308f43746ed66721d9ec8f460732be6674.nl.png differ
diff --git a/translated_images/formula-excel.ad1068c220892f5ead570d12f2394897961d31a5043a1dd4e6fc5d7690c7a14e.he.png b/translated_images/formula-excel.ad1068c220892f5ead570d12f2394897961d31a5043a1dd4e6fc5d7690c7a14e.he.png
new file mode 100644
index 00000000..6eec2f6f
Binary files /dev/null and b/translated_images/formula-excel.ad1068c220892f5ead570d12f2394897961d31a5043a1dd4e6fc5d7690c7a14e.he.png differ
diff --git a/translated_images/formula-excel.ad1068c220892f5ead570d12f2394897961d31a5043a1dd4e6fc5d7690c7a14e.nl.png b/translated_images/formula-excel.ad1068c220892f5ead570d12f2394897961d31a5043a1dd4e6fc5d7690c7a14e.nl.png
new file mode 100644
index 00000000..7c0905fb
Binary files /dev/null and b/translated_images/formula-excel.ad1068c220892f5ead570d12f2394897961d31a5043a1dd4e6fc5d7690c7a14e.nl.png differ
diff --git a/translated_images/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.he.png b/translated_images/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.he.png
new file mode 100644
index 00000000..1db0ef5e
Binary files /dev/null and b/translated_images/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.he.png differ
diff --git a/translated_images/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.nl.png b/translated_images/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.nl.png
new file mode 100644
index 00000000..3da227d7
Binary files /dev/null and b/translated_images/full-data-bar-02.aaa3fda71c63ed564b917841a1886c177dd9a26424142e510c0c0498fd6ca160.nl.png differ
diff --git a/translated_images/full-data-bar.a0b37da71a6cd23610c83d1e737c4f0aff0524724ed527b9bed12c0bac5f2f07.he.png b/translated_images/full-data-bar.a0b37da71a6cd23610c83d1e737c4f0aff0524724ed527b9bed12c0bac5f2f07.he.png
new file mode 100644
index 00000000..3361cb08
Binary files /dev/null and b/translated_images/full-data-bar.a0b37da71a6cd23610c83d1e737c4f0aff0524724ed527b9bed12c0bac5f2f07.he.png differ
diff --git a/translated_images/full-data-bar.a0b37da71a6cd23610c83d1e737c4f0aff0524724ed527b9bed12c0bac5f2f07.nl.png b/translated_images/full-data-bar.a0b37da71a6cd23610c83d1e737c4f0aff0524724ed527b9bed12c0bac5f2f07.nl.png
new file mode 100644
index 00000000..f7d71733
Binary files /dev/null and b/translated_images/full-data-bar.a0b37da71a6cd23610c83d1e737c4f0aff0524724ed527b9bed12c0bac5f2f07.nl.png differ
diff --git a/translated_images/function-excel.be2ae4feddc10ca089f3d4363040d93b7fd046c8d4f83ba975ec46483ee99895.he.png b/translated_images/function-excel.be2ae4feddc10ca089f3d4363040d93b7fd046c8d4f83ba975ec46483ee99895.he.png
new file mode 100644
index 00000000..2327633c
Binary files /dev/null and b/translated_images/function-excel.be2ae4feddc10ca089f3d4363040d93b7fd046c8d4f83ba975ec46483ee99895.he.png differ
diff --git a/translated_images/function-excel.be2ae4feddc10ca089f3d4363040d93b7fd046c8d4f83ba975ec46483ee99895.nl.png b/translated_images/function-excel.be2ae4feddc10ca089f3d4363040d93b7fd046c8d4f83ba975ec46483ee99895.nl.png
new file mode 100644
index 00000000..f87d8ab7
Binary files /dev/null and b/translated_images/function-excel.be2ae4feddc10ca089f3d4363040d93b7fd046c8d4f83ba975ec46483ee99895.nl.png differ
diff --git a/translated_images/graph-db.d13629152f79a9dac895b20fa7d841d4d4d6f6008b1382227c3bbd200fd4cfa1.he.png b/translated_images/graph-db.d13629152f79a9dac895b20fa7d841d4d4d6f6008b1382227c3bbd200fd4cfa1.he.png
new file mode 100644
index 00000000..aa85d01c
Binary files /dev/null and b/translated_images/graph-db.d13629152f79a9dac895b20fa7d841d4d4d6f6008b1382227c3bbd200fd4cfa1.he.png differ
diff --git a/translated_images/graph-db.d13629152f79a9dac895b20fa7d841d4d4d6f6008b1382227c3bbd200fd4cfa1.nl.png b/translated_images/graph-db.d13629152f79a9dac895b20fa7d841d4d4d6f6008b1382227c3bbd200fd4cfa1.nl.png
new file mode 100644
index 00000000..576833b5
Binary files /dev/null and b/translated_images/graph-db.d13629152f79a9dac895b20fa7d841d4d4d6f6008b1382227c3bbd200fd4cfa1.nl.png differ
diff --git a/translated_images/height-boxplot.ccb66b2848b5f51cd28e3acf89512ac7101ad36d0c07fc7b93762c9dcf368d7d.he.png b/translated_images/height-boxplot.ccb66b2848b5f51cd28e3acf89512ac7101ad36d0c07fc7b93762c9dcf368d7d.he.png
new file mode 100644
index 00000000..69b71cac
Binary files /dev/null and b/translated_images/height-boxplot.ccb66b2848b5f51cd28e3acf89512ac7101ad36d0c07fc7b93762c9dcf368d7d.he.png differ
diff --git a/translated_images/height-boxplot.ccb66b2848b5f51cd28e3acf89512ac7101ad36d0c07fc7b93762c9dcf368d7d.nl.png b/translated_images/height-boxplot.ccb66b2848b5f51cd28e3acf89512ac7101ad36d0c07fc7b93762c9dcf368d7d.nl.png
new file mode 100644
index 00000000..09dcc959
Binary files /dev/null and b/translated_images/height-boxplot.ccb66b2848b5f51cd28e3acf89512ac7101ad36d0c07fc7b93762c9dcf368d7d.nl.png differ
diff --git a/translated_images/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.he.png b/translated_images/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.he.png
new file mode 100644
index 00000000..5b41b4fe
Binary files /dev/null and b/translated_images/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.he.png differ
diff --git a/translated_images/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.nl.png b/translated_images/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.nl.png
new file mode 100644
index 00000000..dfa15633
Binary files /dev/null and b/translated_images/histogram-conservation-wb.3c40450eb072c14de7a1a3ec5c0fcba4995531024760741b392911b567fd8b70.nl.png differ
diff --git a/translated_images/histogram-conservation.13b3542e7784e41585a3763ba6dfbfaa2a372bcd9edae90675ad18f7b13fa7e3.he.png b/translated_images/histogram-conservation.13b3542e7784e41585a3763ba6dfbfaa2a372bcd9edae90675ad18f7b13fa7e3.he.png
new file mode 100644
index 00000000..e8202a50
Binary files /dev/null and b/translated_images/histogram-conservation.13b3542e7784e41585a3763ba6dfbfaa2a372bcd9edae90675ad18f7b13fa7e3.he.png differ
diff --git a/translated_images/histogram-conservation.13b3542e7784e41585a3763ba6dfbfaa2a372bcd9edae90675ad18f7b13fa7e3.nl.png b/translated_images/histogram-conservation.13b3542e7784e41585a3763ba6dfbfaa2a372bcd9edae90675ad18f7b13fa7e3.nl.png
new file mode 100644
index 00000000..2c23cf3c
Binary files /dev/null and b/translated_images/histogram-conservation.13b3542e7784e41585a3763ba6dfbfaa2a372bcd9edae90675ad18f7b13fa7e3.nl.png differ
diff --git a/translated_images/kv-db.e8f2b75686bbdfcba0c827b9272c10ae0821611ea0fe98429b9d13194383afa6.he.png b/translated_images/kv-db.e8f2b75686bbdfcba0c827b9272c10ae0821611ea0fe98429b9d13194383afa6.he.png
new file mode 100644
index 00000000..407152fd
Binary files /dev/null and b/translated_images/kv-db.e8f2b75686bbdfcba0c827b9272c10ae0821611ea0fe98429b9d13194383afa6.he.png differ
diff --git a/translated_images/kv-db.e8f2b75686bbdfcba0c827b9272c10ae0821611ea0fe98429b9d13194383afa6.nl.png b/translated_images/kv-db.e8f2b75686bbdfcba0c827b9272c10ae0821611ea0fe98429b9d13194383afa6.nl.png
new file mode 100644
index 00000000..eb340c9e
Binary files /dev/null and b/translated_images/kv-db.e8f2b75686bbdfcba0c827b9272c10ae0821611ea0fe98429b9d13194383afa6.nl.png differ
diff --git a/translated_images/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.he.png b/translated_images/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.he.png
new file mode 100644
index 00000000..9c2d8633
Binary files /dev/null and b/translated_images/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.he.png differ
diff --git a/translated_images/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.nl.png b/translated_images/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.nl.png
new file mode 100644
index 00000000..a9d03420
Binary files /dev/null and b/translated_images/labeled-wingspan-02.6110e2d2401cd5238ccc24dfb6d04a6c19436101f6cec151e3992e719f9f1e1f.nl.png differ
diff --git a/translated_images/labeled-wingspan.900ffedd7e3ec6de17070dac63c1cf624cb083fb5b6a157bbb1d60f327f331aa.he.png b/translated_images/labeled-wingspan.900ffedd7e3ec6de17070dac63c1cf624cb083fb5b6a157bbb1d60f327f331aa.he.png
new file mode 100644
index 00000000..65f7baa0
Binary files /dev/null and b/translated_images/labeled-wingspan.900ffedd7e3ec6de17070dac63c1cf624cb083fb5b6a157bbb1d60f327f331aa.he.png differ
diff --git a/translated_images/labeled-wingspan.900ffedd7e3ec6de17070dac63c1cf624cb083fb5b6a157bbb1d60f327f331aa.nl.png b/translated_images/labeled-wingspan.900ffedd7e3ec6de17070dac63c1cf624cb083fb5b6a157bbb1d60f327f331aa.nl.png
new file mode 100644
index 00000000..31a0d3a1
Binary files /dev/null and b/translated_images/labeled-wingspan.900ffedd7e3ec6de17070dac63c1cf624cb083fb5b6a157bbb1d60f327f331aa.nl.png differ
diff --git a/translated_images/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.he.png b/translated_images/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.he.png
new file mode 100644
index 00000000..6bda1722
Binary files /dev/null and b/translated_images/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.he.png differ
diff --git a/translated_images/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.nl.png b/translated_images/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.nl.png
new file mode 100644
index 00000000..b63ccc9e
Binary files /dev/null and b/translated_images/less-smooth-bodymass.10f4db8b683cc17d17b2d33f22405413142004467a1493d416608dafecfdee23.nl.png differ
diff --git a/translated_images/liaisons.7b440b28f6d07ea430244fdf1fc4c64ff48f473f143b8e921846eda1c302aeba.he.png b/translated_images/liaisons.7b440b28f6d07ea430244fdf1fc4c64ff48f473f143b8e921846eda1c302aeba.he.png
new file mode 100644
index 00000000..1207d625
Binary files /dev/null and b/translated_images/liaisons.7b440b28f6d07ea430244fdf1fc4c64ff48f473f143b8e921846eda1c302aeba.he.png differ
diff --git a/translated_images/liaisons.7b440b28f6d07ea430244fdf1fc4c64ff48f473f143b8e921846eda1c302aeba.nl.png b/translated_images/liaisons.7b440b28f6d07ea430244fdf1fc4c64ff48f473f143b8e921846eda1c302aeba.nl.png
new file mode 100644
index 00000000..551a1ef6
Binary files /dev/null and b/translated_images/liaisons.7b440b28f6d07ea430244fdf1fc4c64ff48f473f143b8e921846eda1c302aeba.nl.png differ
diff --git a/translated_images/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.he.png b/translated_images/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.he.png
new file mode 100644
index 00000000..d3e6b022
Binary files /dev/null and b/translated_images/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.he.png differ
diff --git a/translated_images/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.nl.png b/translated_images/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.nl.png
new file mode 100644
index 00000000..adbb5200
Binary files /dev/null and b/translated_images/liaisons.90ce7360bcf8476558f700bbbaf198ad697d5b5cb2829ba141a89c0add7c6ecd.nl.png differ
diff --git a/translated_images/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.he.png b/translated_images/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.he.png
new file mode 100644
index 00000000..6855c02a
Binary files /dev/null and b/translated_images/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.he.png differ
diff --git a/translated_images/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.nl.png b/translated_images/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.nl.png
new file mode 100644
index 00000000..59e67aa2
Binary files /dev/null and b/translated_images/line1.299b576fbb2a59e60a59e7130030f59836891f90302be084e4e8d14da0562e2a.nl.png differ
diff --git a/translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.he.png b/translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.he.png
new file mode 100644
index 00000000..61234c48
Binary files /dev/null and b/translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.he.png differ
diff --git a/translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.nl.png b/translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.nl.png
new file mode 100644
index 00000000..9e6dc17c
Binary files /dev/null and b/translated_images/line1.f36eb465229a3b1fe385cdc93861aab3939de987d504b05de0b6cd567ef79f43.nl.png differ
diff --git a/translated_images/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.he.png b/translated_images/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.he.png
new file mode 100644
index 00000000..47dc68a8
Binary files /dev/null and b/translated_images/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.he.png differ
diff --git a/translated_images/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.nl.png b/translated_images/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.nl.png
new file mode 100644
index 00000000..e7be4409
Binary files /dev/null and b/translated_images/line2.3b18fcda7176ceba5b6689eaaabb817d49c965e986f11cac1ae3f424030c34d8.nl.png differ
diff --git a/translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.he.png b/translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.he.png
new file mode 100644
index 00000000..2ce85ba2
Binary files /dev/null and b/translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.he.png differ
diff --git a/translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.nl.png b/translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.nl.png
new file mode 100644
index 00000000..5757089f
Binary files /dev/null and b/translated_images/line2.a5b3493dc01058af6402e657aaa9ae1125fafb5e7d6630c777aa60f900a544e4.nl.png differ
diff --git a/translated_images/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.he.png b/translated_images/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.he.png
new file mode 100644
index 00000000..c609c79a
Binary files /dev/null and b/translated_images/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.he.png differ
diff --git a/translated_images/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.nl.png b/translated_images/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.nl.png
new file mode 100644
index 00000000..cd355007
Binary files /dev/null and b/translated_images/max-length-per-order.e5b283d952c78c12b091307c5d3cf67132dad6fefe80a073353b9dc5c2bd3eb8.nl.png differ
diff --git a/translated_images/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.he.png b/translated_images/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.he.png
new file mode 100644
index 00000000..830f00f4
Binary files /dev/null and b/translated_images/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.he.png differ
diff --git a/translated_images/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.nl.png b/translated_images/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.nl.png
new file mode 100644
index 00000000..96713a66
Binary files /dev/null and b/translated_images/max-wingspan-02.e79fd847b2640b89e21e340a3a9f4c5d4b224c4fcd65f54385e84f1c9ed26d52.nl.png differ
diff --git a/translated_images/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.he.png b/translated_images/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.he.png
new file mode 100644
index 00000000..9fbfd15e
Binary files /dev/null and b/translated_images/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.he.png differ
diff --git a/translated_images/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.nl.png b/translated_images/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.nl.png
new file mode 100644
index 00000000..6f55e8f6
Binary files /dev/null and b/translated_images/max-wingspan-labels-02.aa90e826ca49a9d1dde78075e9755c1849ef56a4e9ec60f7e9f3806daf9283e2.nl.png differ
diff --git a/translated_images/max-wingspan-labels.46f0cc3c48edd4e00e6ab6d8797e2717a33b4b94d97af3539c5442a1299d03c1.he.png b/translated_images/max-wingspan-labels.46f0cc3c48edd4e00e6ab6d8797e2717a33b4b94d97af3539c5442a1299d03c1.he.png
new file mode 100644
index 00000000..0c37ab05
Binary files /dev/null and b/translated_images/max-wingspan-labels.46f0cc3c48edd4e00e6ab6d8797e2717a33b4b94d97af3539c5442a1299d03c1.he.png differ
diff --git a/translated_images/max-wingspan-labels.46f0cc3c48edd4e00e6ab6d8797e2717a33b4b94d97af3539c5442a1299d03c1.nl.png b/translated_images/max-wingspan-labels.46f0cc3c48edd4e00e6ab6d8797e2717a33b4b94d97af3539c5442a1299d03c1.nl.png
new file mode 100644
index 00000000..0c37ab05
Binary files /dev/null and b/translated_images/max-wingspan-labels.46f0cc3c48edd4e00e6ab6d8797e2717a33b4b94d97af3539c5442a1299d03c1.nl.png differ
diff --git a/translated_images/max-wingspan.0b8d0858436414aa1c53556bfd07e7d4267120782d236abe10e0473252de0760.he.png b/translated_images/max-wingspan.0b8d0858436414aa1c53556bfd07e7d4267120782d236abe10e0473252de0760.he.png
new file mode 100644
index 00000000..72f5a3e4
Binary files /dev/null and b/translated_images/max-wingspan.0b8d0858436414aa1c53556bfd07e7d4267120782d236abe10e0473252de0760.he.png differ
diff --git a/translated_images/max-wingspan.0b8d0858436414aa1c53556bfd07e7d4267120782d236abe10e0473252de0760.nl.png b/translated_images/max-wingspan.0b8d0858436414aa1c53556bfd07e7d4267120782d236abe10e0473252de0760.nl.png
new file mode 100644
index 00000000..72f5a3e4
Binary files /dev/null and b/translated_images/max-wingspan.0b8d0858436414aa1c53556bfd07e7d4267120782d236abe10e0473252de0760.nl.png differ
diff --git a/translated_images/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.he.png b/translated_images/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.he.png
new file mode 100644
index 00000000..1a16cab4
Binary files /dev/null and b/translated_images/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.he.png differ
diff --git a/translated_images/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.nl.png b/translated_images/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.nl.png
new file mode 100644
index 00000000..051db818
Binary files /dev/null and b/translated_images/multi.56548caa9eae8d0fd9012a8586295538c7f4f426e2abc714ba070e2e4b1fc2c1.nl.png differ
diff --git a/translated_images/new-container.650e10c7a20a5f83824264bfaa0f818d8c203f98136f4647385bd0c369b5035b.he.png b/translated_images/new-container.650e10c7a20a5f83824264bfaa0f818d8c203f98136f4647385bd0c369b5035b.he.png
new file mode 100644
index 00000000..b5779c5a
Binary files /dev/null and b/translated_images/new-container.650e10c7a20a5f83824264bfaa0f818d8c203f98136f4647385bd0c369b5035b.he.png differ
diff --git a/translated_images/new-container.650e10c7a20a5f83824264bfaa0f818d8c203f98136f4647385bd0c369b5035b.nl.png b/translated_images/new-container.650e10c7a20a5f83824264bfaa0f818d8c203f98136f4647385bd0c369b5035b.nl.png
new file mode 100644
index 00000000..38c57b90
Binary files /dev/null and b/translated_images/new-container.650e10c7a20a5f83824264bfaa0f818d8c203f98136f4647385bd0c369b5035b.nl.png differ
diff --git a/translated_images/normal-histogram.dfae0d67c202137d552d0015fb87581eca263925e512404f3c12d8885315432e.he.png b/translated_images/normal-histogram.dfae0d67c202137d552d0015fb87581eca263925e512404f3c12d8885315432e.he.png
new file mode 100644
index 00000000..64d6017c
Binary files /dev/null and b/translated_images/normal-histogram.dfae0d67c202137d552d0015fb87581eca263925e512404f3c12d8885315432e.he.png differ
diff --git a/translated_images/normal-histogram.dfae0d67c202137d552d0015fb87581eca263925e512404f3c12d8885315432e.nl.png b/translated_images/normal-histogram.dfae0d67c202137d552d0015fb87581eca263925e512404f3c12d8885315432e.nl.png
new file mode 100644
index 00000000..3e9ab8ac
Binary files /dev/null and b/translated_images/normal-histogram.dfae0d67c202137d552d0015fb87581eca263925e512404f3c12d8885315432e.nl.png differ
diff --git a/translated_images/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.he.png b/translated_images/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.he.png
new file mode 100644
index 00000000..04a95b18
Binary files /dev/null and b/translated_images/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.he.png differ
diff --git a/translated_images/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.nl.png b/translated_images/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.nl.png
new file mode 100644
index 00000000..eefd99fc
Binary files /dev/null and b/translated_images/notebook-1.12998af7b02c83f536c11b3aeba561be16e0f05e94146600728ec64270ce1105.nl.png differ
diff --git a/translated_images/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.he.png b/translated_images/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.he.png
new file mode 100644
index 00000000..f9c96279
Binary files /dev/null and b/translated_images/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.he.png differ
diff --git a/translated_images/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.nl.png b/translated_images/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.nl.png
new file mode 100644
index 00000000..a1ccc15f
Binary files /dev/null and b/translated_images/notebook-2.9a657c037e34f1cf26c0212f5ee9e2da8545b3e107c7682c55114e494167a8aa.nl.png differ
diff --git a/translated_images/parts-of-spreadsheet.120711c82aa18a45c3e62a491a15bba0a31ab0e9db407ec022702fed8ffd89bf.he.png b/translated_images/parts-of-spreadsheet.120711c82aa18a45c3e62a491a15bba0a31ab0e9db407ec022702fed8ffd89bf.he.png
new file mode 100644
index 00000000..d8eb4bac
Binary files /dev/null and b/translated_images/parts-of-spreadsheet.120711c82aa18a45c3e62a491a15bba0a31ab0e9db407ec022702fed8ffd89bf.he.png differ
diff --git a/translated_images/parts-of-spreadsheet.120711c82aa18a45c3e62a491a15bba0a31ab0e9db407ec022702fed8ffd89bf.nl.png b/translated_images/parts-of-spreadsheet.120711c82aa18a45c3e62a491a15bba0a31ab0e9db407ec022702fed8ffd89bf.nl.png
new file mode 100644
index 00000000..1137d6b8
Binary files /dev/null and b/translated_images/parts-of-spreadsheet.120711c82aa18a45c3e62a491a15bba0a31ab0e9db407ec022702fed8ffd89bf.nl.png differ
diff --git a/translated_images/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.he.png b/translated_images/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.he.png
new file mode 100644
index 00000000..071d443f
Binary files /dev/null and b/translated_images/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.he.png differ
diff --git a/translated_images/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.nl.png b/translated_images/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.nl.png
new file mode 100644
index 00000000..0cf4740a
Binary files /dev/null and b/translated_images/pie1-wb.685df063673751f4b0b82127f7a52c7f9a920192f22ae61ad28412ba9ace97bf.nl.png differ
diff --git a/translated_images/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.he.png b/translated_images/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.he.png
new file mode 100644
index 00000000..975239a1
Binary files /dev/null and b/translated_images/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.he.png differ
diff --git a/translated_images/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.nl.png b/translated_images/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.nl.png
new file mode 100644
index 00000000..c8646032
Binary files /dev/null and b/translated_images/pie1-wb.e201f2fcc335413143ce37650fb7f5f0bb21358e7823a327ed8644dfb84be9db.nl.png differ
diff --git a/translated_images/pie1.8f6a8bfac96de60e38ced1a1ac39fd9caafa95142b3bbcb65d540bcad678806f.he.png b/translated_images/pie1.8f6a8bfac96de60e38ced1a1ac39fd9caafa95142b3bbcb65d540bcad678806f.he.png
new file mode 100644
index 00000000..e05ed728
Binary files /dev/null and b/translated_images/pie1.8f6a8bfac96de60e38ced1a1ac39fd9caafa95142b3bbcb65d540bcad678806f.he.png differ
diff --git a/translated_images/pie1.8f6a8bfac96de60e38ced1a1ac39fd9caafa95142b3bbcb65d540bcad678806f.nl.png b/translated_images/pie1.8f6a8bfac96de60e38ced1a1ac39fd9caafa95142b3bbcb65d540bcad678806f.nl.png
new file mode 100644
index 00000000..c8cd4da7
Binary files /dev/null and b/translated_images/pie1.8f6a8bfac96de60e38ced1a1ac39fd9caafa95142b3bbcb65d540bcad678806f.nl.png differ
diff --git a/translated_images/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.he.png b/translated_images/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.he.png
new file mode 100644
index 00000000..9b4f8fe9
Binary files /dev/null and b/translated_images/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.he.png differ
diff --git a/translated_images/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.nl.png b/translated_images/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.nl.png
new file mode 100644
index 00000000..88670461
Binary files /dev/null and b/translated_images/planetary-computer-explorer.c1e95a9b053167d64e2e8e4347cfb689e47e2037c33103fc1bbea1a149d4f85b.nl.png differ
diff --git a/translated_images/probability-density.a8aad29f17a14afb519b407c7b6edeb9f3f9aa5f69c9e6d9445f604e5f8a2bf7.he.png b/translated_images/probability-density.a8aad29f17a14afb519b407c7b6edeb9f3f9aa5f69c9e6d9445f604e5f8a2bf7.he.png
new file mode 100644
index 00000000..d2b4015e
Binary files /dev/null and b/translated_images/probability-density.a8aad29f17a14afb519b407c7b6edeb9f3f9aa5f69c9e6d9445f604e5f8a2bf7.he.png differ
diff --git a/translated_images/probability-density.a8aad29f17a14afb519b407c7b6edeb9f3f9aa5f69c9e6d9445f604e5f8a2bf7.nl.png b/translated_images/probability-density.a8aad29f17a14afb519b407c7b6edeb9f3f9aa5f69c9e6d9445f604e5f8a2bf7.nl.png
new file mode 100644
index 00000000..d24ff6b4
Binary files /dev/null and b/translated_images/probability-density.a8aad29f17a14afb519b407c7b6edeb9f3f9aa5f69c9e6d9445f604e5f8a2bf7.nl.png differ
diff --git a/translated_images/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.he.png b/translated_images/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.he.png
new file mode 100644
index 00000000..48df8444
Binary files /dev/null and b/translated_images/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.he.png differ
diff --git a/translated_images/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.nl.png b/translated_images/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.nl.png
new file mode 100644
index 00000000..2279b4b8
Binary files /dev/null and b/translated_images/project-schema.420e56d495624541eaecf2b737f138c86fb7d8162bb1c0bf8783c350872ffc4d.nl.png differ
diff --git a/translated_images/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.he.png b/translated_images/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.he.png
new file mode 100644
index 00000000..6e805407
Binary files /dev/null and b/translated_images/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.he.png differ
diff --git a/translated_images/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.nl.png b/translated_images/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.nl.png
new file mode 100644
index 00000000..2279b4b8
Binary files /dev/null and b/translated_images/project-schema.736f6e403f321eb48d10242b3f4334dc6ccf0eabef8ff87daf52b89781389fcb.nl.png differ
diff --git a/translated_images/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.he.png b/translated_images/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.he.png
new file mode 100644
index 00000000..54fe9a85
Binary files /dev/null and b/translated_images/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.he.png differ
diff --git a/translated_images/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.nl.png b/translated_images/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.nl.png
new file mode 100644
index 00000000..0133db2f
Binary files /dev/null and b/translated_images/scatter-wb.9d98b0ed7f0388af979441853361a11df5f518f5307938a503ca7913e986111b.nl.png differ
diff --git a/translated_images/scatter.520a43eceb46dbcb96899da0f580f3f3615cf9dba38c9c84e52ebc6b4b48e3ff.he.png b/translated_images/scatter.520a43eceb46dbcb96899da0f580f3f3615cf9dba38c9c84e52ebc6b4b48e3ff.he.png
new file mode 100644
index 00000000..12f314ae
Binary files /dev/null and b/translated_images/scatter.520a43eceb46dbcb96899da0f580f3f3615cf9dba38c9c84e52ebc6b4b48e3ff.he.png differ
diff --git a/translated_images/scatter.520a43eceb46dbcb96899da0f580f3f3615cf9dba38c9c84e52ebc6b4b48e3ff.nl.png b/translated_images/scatter.520a43eceb46dbcb96899da0f580f3f3615cf9dba38c9c84e52ebc6b4b48e3ff.nl.png
new file mode 100644
index 00000000..4b96709c
Binary files /dev/null and b/translated_images/scatter.520a43eceb46dbcb96899da0f580f3f3615cf9dba38c9c84e52ebc6b4b48e3ff.nl.png differ
diff --git a/translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.he.png b/translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.he.png
new file mode 100644
index 00000000..2b886e6a
Binary files /dev/null and b/translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.he.png differ
diff --git a/translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.nl.png b/translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.nl.png
new file mode 100644
index 00000000..928975ad
Binary files /dev/null and b/translated_images/scatter1.5e1aa5fd6706c5d12b5e503ccb77f8a930f8620f539f524ddf56a16c039a5d2f.nl.png differ
diff --git a/translated_images/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.he.png b/translated_images/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.he.png
new file mode 100644
index 00000000..1166b3e0
Binary files /dev/null and b/translated_images/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.he.png differ
diff --git a/translated_images/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.nl.png b/translated_images/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.nl.png
new file mode 100644
index 00000000..ccb6be3d
Binary files /dev/null and b/translated_images/scatter1.86b8900674d88b26dd3353a83fe604e9ab3722c4680cc40ee9beb452ff02cdea.nl.png differ
diff --git a/translated_images/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.he.png b/translated_images/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.he.png
new file mode 100644
index 00000000..72aa92aa
Binary files /dev/null and b/translated_images/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.he.png differ
diff --git a/translated_images/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.nl.png b/translated_images/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.nl.png
new file mode 100644
index 00000000..9cdf762d
Binary files /dev/null and b/translated_images/scatter2.4d1cbc693bad20e2b563888747eb6bdf65b73ce449d903f7cd4068a78502dcff.nl.png differ
diff --git a/translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.he.png b/translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.he.png
new file mode 100644
index 00000000..dbc8eb5a
Binary files /dev/null and b/translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.he.png differ
diff --git a/translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.nl.png b/translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.nl.png
new file mode 100644
index 00000000..d2a06150
Binary files /dev/null and b/translated_images/scatter2.c0041a58621ca702990b001aa0b20cd68c1e1814417139af8a7211a2bed51c5f.nl.png differ
diff --git a/translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.he.png b/translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.he.png
new file mode 100644
index 00000000..eb86e1f3
Binary files /dev/null and b/translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.he.png differ
diff --git a/translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.nl.png b/translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.nl.png
new file mode 100644
index 00000000..eb86e1f3
Binary files /dev/null and b/translated_images/scatter3.3c160a3d1dcb36b37900ebb4cf97f34036f28ae2b7b8e6062766c7c1dfc00853.nl.png differ
diff --git a/translated_images/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.he.png b/translated_images/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.he.png
new file mode 100644
index 00000000..f3993d21
Binary files /dev/null and b/translated_images/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.he.png differ
diff --git a/translated_images/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.nl.png b/translated_images/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.nl.png
new file mode 100644
index 00000000..a5584c32
Binary files /dev/null and b/translated_images/scatter3.722d21e6f20b3ea2e18339bb9b10d75906126715eb7d5fdc88fe74dcb6d7066a.nl.png differ
diff --git a/translated_images/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.he.png b/translated_images/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.he.png
new file mode 100644
index 00000000..557b6c5c
Binary files /dev/null and b/translated_images/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.he.png differ
diff --git a/translated_images/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.nl.png b/translated_images/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.nl.png
new file mode 100644
index 00000000..015c1eec
Binary files /dev/null and b/translated_images/scatterplot-wingspan-02.1c33790094ce36a75f5fb45b25ed2cf27f0356ea609e43c11e97a2cedd7011a4.nl.png differ
diff --git a/translated_images/scatterplot-wingspan.bdab448702939bb32a0d3522a9fcd8aa36d5f428aca5e8655a677eb6d0597111.he.png b/translated_images/scatterplot-wingspan.bdab448702939bb32a0d3522a9fcd8aa36d5f428aca5e8655a677eb6d0597111.he.png
new file mode 100644
index 00000000..420674b6
Binary files /dev/null and b/translated_images/scatterplot-wingspan.bdab448702939bb32a0d3522a9fcd8aa36d5f428aca5e8655a677eb6d0597111.he.png differ
diff --git a/translated_images/scatterplot-wingspan.bdab448702939bb32a0d3522a9fcd8aa36d5f428aca5e8655a677eb6d0597111.nl.png b/translated_images/scatterplot-wingspan.bdab448702939bb32a0d3522a9fcd8aa36d5f428aca5e8655a677eb6d0597111.nl.png
new file mode 100644
index 00000000..420674b6
Binary files /dev/null and b/translated_images/scatterplot-wingspan.bdab448702939bb32a0d3522a9fcd8aa36d5f428aca5e8655a677eb6d0597111.nl.png differ
diff --git a/translated_images/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.he.png b/translated_images/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.he.png
new file mode 100644
index 00000000..9cb05f01
Binary files /dev/null and b/translated_images/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.he.png differ
diff --git a/translated_images/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.nl.png b/translated_images/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.nl.png
new file mode 100644
index 00000000..a2075caf
Binary files /dev/null and b/translated_images/stacked-bar-chart.0c92264e89da7b391a7490224d1e7059a020e8b74dcd354414aeac78871c02f1.nl.png differ
diff --git a/translated_images/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.he.png b/translated_images/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.he.png
new file mode 100644
index 00000000..34941943
Binary files /dev/null and b/translated_images/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.he.png differ
diff --git a/translated_images/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.nl.png b/translated_images/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.nl.png
new file mode 100644
index 00000000..41bc4d10
Binary files /dev/null and b/translated_images/superimposed-02.f03058536baeb2ed7864f01102538464d4c2fd7ade881ddd7d5ba74dc5d2fdae.nl.png differ
diff --git a/translated_images/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.he.png b/translated_images/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.he.png
new file mode 100644
index 00000000..3194900a
Binary files /dev/null and b/translated_images/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.he.png differ
diff --git a/translated_images/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.nl.png b/translated_images/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.nl.png
new file mode 100644
index 00000000..be3a1299
Binary files /dev/null and b/translated_images/superimposed-values.5363f0705a1da4167625a373a1064331ea3cb7a06a297297d0734fcc9b3819a0.nl.png differ
diff --git a/translated_images/superimposed.8b5bd0e8825d9c5c06e2b15d61e3f7ebdd36678f2bdfa1e74c57e24e4486885a.he.png b/translated_images/superimposed.8b5bd0e8825d9c5c06e2b15d61e3f7ebdd36678f2bdfa1e74c57e24e4486885a.he.png
new file mode 100644
index 00000000..462346a6
Binary files /dev/null and b/translated_images/superimposed.8b5bd0e8825d9c5c06e2b15d61e3f7ebdd36678f2bdfa1e74c57e24e4486885a.he.png differ
diff --git a/translated_images/superimposed.8b5bd0e8825d9c5c06e2b15d61e3f7ebdd36678f2bdfa1e74c57e24e4486885a.nl.png b/translated_images/superimposed.8b5bd0e8825d9c5c06e2b15d61e3f7ebdd36678f2bdfa1e74c57e24e4486885a.nl.png
new file mode 100644
index 00000000..462346a6
Binary files /dev/null and b/translated_images/superimposed.8b5bd0e8825d9c5c06e2b15d61e3f7ebdd36678f2bdfa1e74c57e24e4486885a.nl.png differ
diff --git a/translated_images/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.he.png b/translated_images/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.he.png
new file mode 100644
index 00000000..657f1ec2
Binary files /dev/null and b/translated_images/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.he.png differ
diff --git a/translated_images/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.nl.png b/translated_images/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.nl.png
new file mode 100644
index 00000000..bf4dd141
Binary files /dev/null and b/translated_images/tdsp-lifecycle2.e19029d598e2e73d5ef8a4b98837d688ec6044fe332c905d4dbb69eb6d5c1d96.nl.png differ
diff --git a/translated_images/timeseries-1.80de678ab1cf727e50e00bcf24009fa2b0a8b90ebc43e34b99a345227d28e467.he.png b/translated_images/timeseries-1.80de678ab1cf727e50e00bcf24009fa2b0a8b90ebc43e34b99a345227d28e467.he.png
new file mode 100644
index 00000000..243976e6
Binary files /dev/null and b/translated_images/timeseries-1.80de678ab1cf727e50e00bcf24009fa2b0a8b90ebc43e34b99a345227d28e467.he.png differ
diff --git a/translated_images/timeseries-1.80de678ab1cf727e50e00bcf24009fa2b0a8b90ebc43e34b99a345227d28e467.nl.png b/translated_images/timeseries-1.80de678ab1cf727e50e00bcf24009fa2b0a8b90ebc43e34b99a345227d28e467.nl.png
new file mode 100644
index 00000000..6ef69d91
Binary files /dev/null and b/translated_images/timeseries-1.80de678ab1cf727e50e00bcf24009fa2b0a8b90ebc43e34b99a345227d28e467.nl.png differ
diff --git a/translated_images/timeseries-2.aae51d575c55181ceda81ade8c546a2fc2024f9136934386d57b8a189d7570ff.he.png b/translated_images/timeseries-2.aae51d575c55181ceda81ade8c546a2fc2024f9136934386d57b8a189d7570ff.he.png
new file mode 100644
index 00000000..84e9d954
Binary files /dev/null and b/translated_images/timeseries-2.aae51d575c55181ceda81ade8c546a2fc2024f9136934386d57b8a189d7570ff.he.png differ
diff --git a/translated_images/timeseries-2.aae51d575c55181ceda81ade8c546a2fc2024f9136934386d57b8a189d7570ff.nl.png b/translated_images/timeseries-2.aae51d575c55181ceda81ade8c546a2fc2024f9136934386d57b8a189d7570ff.nl.png
new file mode 100644
index 00000000..8b38fba8
Binary files /dev/null and b/translated_images/timeseries-2.aae51d575c55181ceda81ade8c546a2fc2024f9136934386d57b8a189d7570ff.nl.png differ
diff --git a/translated_images/timeseries-3.f3147cbc8c624881008564bc0b5d9fcc15e7374d339da91766bd0e1c6bd9e3af.he.png b/translated_images/timeseries-3.f3147cbc8c624881008564bc0b5d9fcc15e7374d339da91766bd0e1c6bd9e3af.he.png
new file mode 100644
index 00000000..04a57677
Binary files /dev/null and b/translated_images/timeseries-3.f3147cbc8c624881008564bc0b5d9fcc15e7374d339da91766bd0e1c6bd9e3af.he.png differ
diff --git a/translated_images/timeseries-3.f3147cbc8c624881008564bc0b5d9fcc15e7374d339da91766bd0e1c6bd9e3af.nl.png b/translated_images/timeseries-3.f3147cbc8c624881008564bc0b5d9fcc15e7374d339da91766bd0e1c6bd9e3af.nl.png
new file mode 100644
index 00000000..2e959d76
Binary files /dev/null and b/translated_images/timeseries-3.f3147cbc8c624881008564bc0b5d9fcc15e7374d339da91766bd0e1c6bd9e3af.nl.png differ
diff --git a/translated_images/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.he.png b/translated_images/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.he.png
new file mode 100644
index 00000000..28171bc0
Binary files /dev/null and b/translated_images/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.he.png differ
diff --git a/translated_images/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.nl.png b/translated_images/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.nl.png
new file mode 100644
index 00000000..722b9322
Binary files /dev/null and b/translated_images/tornado.2880ffc7f135f82b5e5328624799010abefd1080ae4b7ecacbdc7d792f1d8849.nl.png differ
diff --git a/translated_images/tornado.9f42168791208f970d6faefc11d1226d7ca89518013b14aa66b1c9edcd7678d2.he.png b/translated_images/tornado.9f42168791208f970d6faefc11d1226d7ca89518013b14aa66b1c9edcd7678d2.he.png
new file mode 100644
index 00000000..9347103a
Binary files /dev/null and b/translated_images/tornado.9f42168791208f970d6faefc11d1226d7ca89518013b14aa66b1c9edcd7678d2.he.png differ
diff --git a/translated_images/tornado.9f42168791208f970d6faefc11d1226d7ca89518013b14aa66b1c9edcd7678d2.nl.png b/translated_images/tornado.9f42168791208f970d6faefc11d1226d7ca89518013b14aa66b1c9edcd7678d2.nl.png
new file mode 100644
index 00000000..b16986a0
Binary files /dev/null and b/translated_images/tornado.9f42168791208f970d6faefc11d1226d7ca89518013b14aa66b1c9edcd7678d2.nl.png differ
diff --git a/translated_images/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.he.png b/translated_images/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.he.png
new file mode 100644
index 00000000..76060ca9
Binary files /dev/null and b/translated_images/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.he.png differ
diff --git a/translated_images/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.nl.png b/translated_images/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.nl.png
new file mode 100644
index 00000000..584650be
Binary files /dev/null and b/translated_images/video-def-ds.6623ee2392ef1abf6d7faf3fad10a4163642811749da75f44e35a5bb121de15c.nl.png differ
diff --git a/translated_images/video-ds-python.245247dc811db8e4d5ac420246de8a118c63fd28f6a56578d08b630ae549f260.he.png b/translated_images/video-ds-python.245247dc811db8e4d5ac420246de8a118c63fd28f6a56578d08b630ae549f260.he.png
new file mode 100644
index 00000000..62a28cb9
Binary files /dev/null and b/translated_images/video-ds-python.245247dc811db8e4d5ac420246de8a118c63fd28f6a56578d08b630ae549f260.he.png differ
diff --git a/translated_images/video-ds-python.245247dc811db8e4d5ac420246de8a118c63fd28f6a56578d08b630ae549f260.nl.png b/translated_images/video-ds-python.245247dc811db8e4d5ac420246de8a118c63fd28f6a56578d08b630ae549f260.nl.png
new file mode 100644
index 00000000..4600a9bd
Binary files /dev/null and b/translated_images/video-ds-python.245247dc811db8e4d5ac420246de8a118c63fd28f6a56578d08b630ae549f260.nl.png differ
diff --git a/translated_images/video-prob-and-stats.e4282e5efa2f2543400843ed98b1057065c9600cebfc8a728e8931b5702b2ae4.he.png b/translated_images/video-prob-and-stats.e4282e5efa2f2543400843ed98b1057065c9600cebfc8a728e8931b5702b2ae4.he.png
new file mode 100644
index 00000000..d10dfa76
Binary files /dev/null and b/translated_images/video-prob-and-stats.e4282e5efa2f2543400843ed98b1057065c9600cebfc8a728e8931b5702b2ae4.he.png differ
diff --git a/translated_images/video-prob-and-stats.e4282e5efa2f2543400843ed98b1057065c9600cebfc8a728e8931b5702b2ae4.nl.png b/translated_images/video-prob-and-stats.e4282e5efa2f2543400843ed98b1057065c9600cebfc8a728e8931b5702b2ae4.nl.png
new file mode 100644
index 00000000..2ab25c20
Binary files /dev/null and b/translated_images/video-prob-and-stats.e4282e5efa2f2543400843ed98b1057065c9600cebfc8a728e8931b5702b2ae4.nl.png differ
diff --git a/translated_images/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.he.png b/translated_images/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.he.png
new file mode 100644
index 00000000..752b2859
Binary files /dev/null and b/translated_images/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.he.png differ
diff --git a/translated_images/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.nl.png b/translated_images/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.nl.png
new file mode 100644
index 00000000..9edba604
Binary files /dev/null and b/translated_images/waffle.5455dbae4ccf17d53bb40ff0a657ecef7b8aa967e27a19cc96325bd81598f65e.nl.png differ
diff --git a/translated_images/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.he.png b/translated_images/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.he.png
new file mode 100644
index 00000000..e3ec5858
Binary files /dev/null and b/translated_images/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.he.png differ
diff --git a/translated_images/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.nl.png b/translated_images/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.nl.png
new file mode 100644
index 00000000..33b46b12
Binary files /dev/null and b/translated_images/waffle.aaa75c5337735a6ef32ace0ffb6506ef49e5aefe870ffd72b1bb080f4843c217.nl.png differ
diff --git a/translated_images/weight-boxplot.1dbab1c03af26f8a008fff4e17680082c8ab147d6df646cbac440bbf8f5b9c42.he.png b/translated_images/weight-boxplot.1dbab1c03af26f8a008fff4e17680082c8ab147d6df646cbac440bbf8f5b9c42.he.png
new file mode 100644
index 00000000..4e9253f3
Binary files /dev/null and b/translated_images/weight-boxplot.1dbab1c03af26f8a008fff4e17680082c8ab147d6df646cbac440bbf8f5b9c42.he.png differ
diff --git a/translated_images/weight-boxplot.1dbab1c03af26f8a008fff4e17680082c8ab147d6df646cbac440bbf8f5b9c42.nl.png b/translated_images/weight-boxplot.1dbab1c03af26f8a008fff4e17680082c8ab147d6df646cbac440bbf8f5b9c42.nl.png
new file mode 100644
index 00000000..c3128ec7
Binary files /dev/null and b/translated_images/weight-boxplot.1dbab1c03af26f8a008fff4e17680082c8ab147d6df646cbac440bbf8f5b9c42.nl.png differ
diff --git a/translated_images/weight-height-relationship.3f06bde4ca2aba9974182c4ef037ed602acd0fbbbbe2ca91cefd838a9e66bcf9.he.png b/translated_images/weight-height-relationship.3f06bde4ca2aba9974182c4ef037ed602acd0fbbbbe2ca91cefd838a9e66bcf9.he.png
new file mode 100644
index 00000000..c340ba6b
Binary files /dev/null and b/translated_images/weight-height-relationship.3f06bde4ca2aba9974182c4ef037ed602acd0fbbbbe2ca91cefd838a9e66bcf9.he.png differ
diff --git a/translated_images/weight-height-relationship.3f06bde4ca2aba9974182c4ef037ed602acd0fbbbbe2ca91cefd838a9e66bcf9.nl.png b/translated_images/weight-height-relationship.3f06bde4ca2aba9974182c4ef037ed602acd0fbbbbe2ca91cefd838a9e66bcf9.nl.png
new file mode 100644
index 00000000..9e637d28
Binary files /dev/null and b/translated_images/weight-height-relationship.3f06bde4ca2aba9974182c4ef037ed602acd0fbbbbe2ca91cefd838a9e66bcf9.nl.png differ
diff --git a/translated_images/weight-histogram.bfd00caf7fc30b145b21e862dba7def41c75635d5280de25d840dd7f0b00545e.he.png b/translated_images/weight-histogram.bfd00caf7fc30b145b21e862dba7def41c75635d5280de25d840dd7f0b00545e.he.png
new file mode 100644
index 00000000..3726f3dc
Binary files /dev/null and b/translated_images/weight-histogram.bfd00caf7fc30b145b21e862dba7def41c75635d5280de25d840dd7f0b00545e.he.png differ
diff --git a/translated_images/weight-histogram.bfd00caf7fc30b145b21e862dba7def41c75635d5280de25d840dd7f0b00545e.nl.png b/translated_images/weight-histogram.bfd00caf7fc30b145b21e862dba7def41c75635d5280de25d840dd7f0b00545e.nl.png
new file mode 100644
index 00000000..5723e3ae
Binary files /dev/null and b/translated_images/weight-histogram.bfd00caf7fc30b145b21e862dba7def41c75635d5280de25d840dd7f0b00545e.nl.png differ
diff --git a/translated_images/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.he.png b/translated_images/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.he.png
new file mode 100644
index 00000000..2b395f87
Binary files /dev/null and b/translated_images/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.he.png differ
diff --git a/translated_images/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.nl.png b/translated_images/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.nl.png
new file mode 100644
index 00000000..7b64bed9
Binary files /dev/null and b/translated_images/wingspan-conservation-collation.4024e9aa6910866aa82f0c6cb6a6b4b925bd10079e6b0ef8f92eefa5a6792f76.nl.png differ
diff --git a/translated_images/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.he.png b/translated_images/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.he.png
new file mode 100644
index 00000000..c4b21d3b
Binary files /dev/null and b/translated_images/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.he.png differ
diff --git a/translated_images/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.nl.png b/translated_images/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.nl.png
new file mode 100644
index 00000000..4c72f60b
Binary files /dev/null and b/translated_images/workspace-1.ac8694d60b073ed1ae8333d71244dc8a9b3e439d54593724f98f1beefdd27b08.nl.png differ
diff --git a/translated_images/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.he.png b/translated_images/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.he.png
new file mode 100644
index 00000000..bfbfa84c
Binary files /dev/null and b/translated_images/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.he.png differ
diff --git a/translated_images/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.nl.png b/translated_images/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.nl.png
new file mode 100644
index 00000000..90ac894a
Binary files /dev/null and b/translated_images/workspace-2.ae7c486db8796147075e4a56566aa819827dd6c4c8d18d64590317c3be625f17.nl.png differ
diff --git a/translated_images/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.he.png b/translated_images/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.he.png
new file mode 100644
index 00000000..0fe82e21
Binary files /dev/null and b/translated_images/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.he.png differ
diff --git a/translated_images/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.nl.png b/translated_images/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.nl.png
new file mode 100644
index 00000000..e050da1a
Binary files /dev/null and b/translated_images/workspace-3.398ca4a5858132cce584db9df10c5a011cd9075eb182e647a77d5cac01771eea.nl.png differ
diff --git a/translated_images/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.he.png b/translated_images/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.he.png
new file mode 100644
index 00000000..f5ba2396
Binary files /dev/null and b/translated_images/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.he.png differ
diff --git a/translated_images/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.nl.png b/translated_images/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.nl.png
new file mode 100644
index 00000000..63e2b3af
Binary files /dev/null and b/translated_images/workspace-4.bac87f6599c4df63e624fc2608990f965887bee551d9dedc71c687b43b986b6a.nl.png differ
diff --git a/translated_images/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.he.png b/translated_images/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.he.png
new file mode 100644
index 00000000..dee0a39c
Binary files /dev/null and b/translated_images/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.he.png differ
diff --git a/translated_images/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.nl.png b/translated_images/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.nl.png
new file mode 100644
index 00000000..7b078a2d
Binary files /dev/null and b/translated_images/workspace-5.a6eb17e0a5e6420018b08bdaf3755ce977f96f1df3ea363d2476a9dce7e15adb.nl.png differ
diff --git a/translated_images/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.he.png b/translated_images/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.he.png
new file mode 100644
index 00000000..b2abb69b
Binary files /dev/null and b/translated_images/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.he.png differ
diff --git a/translated_images/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.nl.png b/translated_images/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.nl.png
new file mode 100644
index 00000000..b9b04c90
Binary files /dev/null and b/translated_images/workspace-6.8dd81fe841797ee17f8f73916769576260b16c4e17e850d277a49db35fd74a15.nl.png differ
diff --git a/translations/fi/README.md b/translations/fi/README.md
index d3431cb4..28ec8481 100644
--- a/translations/fi/README.md
+++ b/translations/fi/README.md
@@ -1,52 +1,49 @@
# Tietojenkäsittelytiede aloittelijoille - Opetussuunnitelma
-Azure Cloud Advocates Microsoftilta ovat iloisia voidessaan tarjota 10 viikon, 20 oppitunnin opetussuunnitelman, joka käsittelee tietojenkäsittelytiedettä. Jokainen oppitunti sisältää ennakko- ja jälkitestit, kirjalliset ohjeet oppitunnin suorittamiseen, ratkaisun ja tehtävän. Projektipohjainen oppimismenetelmämme mahdollistaa oppimisen tekemisen kautta, mikä on todistetusti tehokas tapa omaksua uusia taitoja.
+Azure Cloud Advocates Microsoftilta ovat iloisia voidessaan tarjota 10 viikon ja 20 oppitunnin opetussuunnitelman, joka käsittelee tietojenkäsittelytiedettä. Jokainen oppitunti sisältää ennakko- ja jälkitestit, kirjalliset ohjeet oppitunnin suorittamiseen, ratkaisun ja tehtävän. Projektipohjainen oppimismenetelmämme mahdollistaa oppimisen tekemisen kautta, mikä on todistetusti tehokas tapa omaksua uusia taitoja.
**Sydämelliset kiitokset kirjoittajillemme:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer).
**🙏 Erityiskiitokset 🙏 [Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) -kirjoittajille, arvioijille ja sisällöntuottajille,** erityisesti Aaryan Arora, [Aditya Garg](https://github.com/AdityaGarg00), [Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/), [Ankita Singh](https://www.linkedin.com/in/ankitasingh007), [Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/), [Arpita Das](https://www.linkedin.com/in/arpitadas01/), ChhailBihari Dubey, [Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor), [Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [Majd Safi](https://www.linkedin.com/in/majd-s/), [Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/), [Miguel Correa](https://www.linkedin.com/in/miguelmque/), [Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119), [Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum), [Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/), [Rohit Yadav](https://www.linkedin.com/in/rty2423), Samridhi Sharma, [Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200), [Sheena Narula](https://www.linkedin.com/in/sheena-narua-n/), [Tauqeer Ahmad](https://www.linkedin.com/in/tauqeerahmad5201/), Yogendrasingh Pawar, [Vidushi Gupta](https://www.linkedin.com/in/vidushi-gupta07/), [Jasleen Sondhi](https://www.linkedin.com/in/jasleen-sondhi/)
-| ](./sketchnotes/00-Title.png)|
+||
|:---:|
| Tietojenkäsittelytiede aloittelijoille - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
-## Ilmoitus - Uusi opetussuunnitelma generatiivisesta tekoälystä julkaistu!
+### 🌐 Monikielinen tuki
-Olemme juuri julkaisseet 12 oppitunnin opetussuunnitelman generatiivisesta tekoälystä. Opit muun muassa:
+#### Tuettu GitHub Actionin kautta (automaattinen ja aina ajan tasalla)
-- kehotteiden ja kehotteiden suunnittelun perusteet
-- tekstin ja kuvien sovellusten luomisen
-- hakusovellusten kehittämisen
+[French](../fr/README.md) | [Spanish](../es/README.md) | [German](../de/README.md) | [Russian](../ru/README.md) | [Arabic](../ar/README.md) | [Persian (Farsi)](../fa/README.md) | [Urdu](../ur/README.md) | [Chinese (Simplified)](../zh/README.md) | [Chinese (Traditional, Macau)](../mo/README.md) | [Chinese (Traditional, Hong Kong)](../hk/README.md) | [Chinese (Traditional, Taiwan)](../tw/README.md) | [Japanese](../ja/README.md) | [Korean](../ko/README.md) | [Hindi](../hi/README.md) | [Bengali](../bn/README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Portuguese (Portugal)](../pt/README.md) | [Portuguese (Brazil)](../br/README.md) | [Italian](../it/README.md) | [Polish](../pl/README.md) | [Turkish](../tr/README.md) | [Greek](../el/README.md) | [Thai](../th/README.md) | [Swedish](../sv/README.md) | [Danish](../da/README.md) | [Norwegian](../no/README.md) | [Finnish](./README.md) | [Dutch](../nl/README.md) | [Hebrew](../he/README.md) | [Vietnamese](../vi/README.md) | [Indonesian](../id/README.md) | [Malay](../ms/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Swahili](../sw/README.md) | [Hungarian](../hu/README.md) | [Czech](../cs/README.md) | [Slovak](../sk/README.md) | [Romanian](../ro/README.md) | [Bulgarian](../bg/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Croatian](../hr/README.md) | [Slovenian](../sl/README.md) | [Ukrainian](../uk/README.md) | [Burmese (Myanmar)](../my/README.md)
-Kuten aina, mukana on oppitunteja, tehtäviä, tietotarkistuksia ja haasteita.
+**Jos haluat lisätä muita kieliä, tuetut kielet löytyvät [täältä](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md)**
-Tutustu siihen:
-
-> https://aka.ms/genai-beginners
+#### Liity yhteisöömme
+[](https://discord.gg/kzRShWzttr)
# Oletko opiskelija?
Aloita seuraavilla resursseilla:
-- [Opiskelijasivusto](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) Tältä sivulta löydät aloitteleville suunnattuja resursseja, opiskelijapaketit ja jopa tapoja saada ilmainen sertifikaattivoucher. Tämä on sivu, jonka haluat lisätä kirjanmerkkeihin ja tarkistaa säännöllisesti, sillä päivitämme sisältöä vähintään kuukausittain.
-- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) Liity maailmanlaajuiseen opiskelijalähettiläiden yhteisöön, tämä voi olla sinun tiesi Microsoftille.
+- [Student Hub -sivu](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) Tältä sivulta löydät aloitusresursseja, opiskelijapaketteja ja jopa tapoja saada ilmainen sertifikaattikoe. Tämä on sivu, jonka haluat lisätä kirjanmerkkeihin ja tarkistaa säännöllisesti, sillä päivitämme sisältöä vähintään kuukausittain.
+- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) Liity globaaliin opiskelijalähettiläiden yhteisöön, tämä voi olla sinun tiesi Microsoftille.
# Aloittaminen
-> **Opettajille**: olemme [lisänneet joitakin ehdotuksia](for-teachers.md) tämän opetussuunnitelman käyttöön. Haluaisimme kuulla palautettasi [keskustelufoorumillamme](https://github.com/microsoft/Data-Science-For-Beginners/discussions)!
+> **Opettajat**: olemme [lisänneet joitakin ehdotuksia](for-teachers.md) tämän opetussuunnitelman käyttöön. Haluaisimme kuulla palautettanne [keskustelufoorumillamme](https://github.com/microsoft/Data-Science-For-Beginners/discussions)!
-> **[Opiskelijoille](https://aka.ms/student-page)**: jos käytät tätä opetussuunnitelmaa itsenäisesti, haarauta koko repo ja suorita harjoitukset itsenäisesti aloittaen ennakkotestistä. Lue sitten oppitunti ja suorita loput tehtävät. Yritä luoda projektit ymmärtämällä oppitunnit sen sijaan, että kopioisit ratkaisukoodin; kuitenkin kyseinen koodi on saatavilla /solutions-kansioissa jokaisessa projektiin perustuvassa oppitunnissa. Toinen idea on muodostaa opiskeluryhmä ystävien kanssa ja käydä sisältö läpi yhdessä. Lisäopiskelua varten suosittelemme [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum).
+> **[Opiskelijat](https://aka.ms/student-page)**: jos haluat käyttää tätä opetussuunnitelmaa itsenäisesti, haaroita koko repositorio ja suorita harjoitukset itsenäisesti aloittaen ennakkotestistä. Lue sitten luento ja suorita loput tehtävät. Yritä luoda projektit ymmärtämällä oppitunnit sen sijaan, että kopioisit ratkaisukoodin; kuitenkin kyseinen koodi on saatavilla /solutions-kansioissa jokaisessa projektiin perustuvassa oppitunnissa. Toinen idea olisi muodostaa opiskeluryhmä ystävien kanssa ja käydä sisältö yhdessä läpi. Lisäopiskelua varten suosittelemme [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum).
-## Tapaa tiimi
+## Tutustu tiimiin
[](https://youtu.be/8mzavjQSMM4 "Promo video")
@@ -54,93 +51,86 @@ Aloita seuraavilla resursseilla:
> 🎥 Klikkaa yllä olevaa kuvaa nähdäksesi videon projektista ja sen tekijöistä!
-## Opetusmenetelmät
-
-Olemme valinneet kaksi pedagogista periaatetta tätä opetussuunnitelmaa rakentaessamme: varmistamme, että se on projektipohjainen ja että se sisältää usein toistuvia testejä. Tämän sarjan lopussa opiskelijat ovat oppineet tietojenkäsittelytieteen perusperiaatteet, mukaan lukien eettiset käsitteet, datan valmistelun, erilaiset tavat työskennellä datan kanssa, datan visualisoinnin, data-analyysin, tietojenkäsittelytieteen käytännön sovellukset ja paljon muuta.
-
-Lisäksi matalan kynnyksen testi ennen oppituntia suuntaa opiskelijan huomion oppimisen aiheeseen, kun taas toinen testi oppitunnin jälkeen varmistaa paremman tiedon säilymisen. Tämä opetussuunnitelma on suunniteltu joustavaksi ja hauskaksi, ja sen voi suorittaa kokonaan tai osittain. Projektit alkavat pienistä ja muuttuvat yhä monimutkaisemmiksi 10 viikon jakson loppua kohden.
+## Pedagogiikka
-> Löydä [käytössäännöt](CODE_OF_CONDUCT.md), [osallistumisohjeet](CONTRIBUTING.md), [käännösohjeet](TRANSLATIONS.md). Otamme mielellämme vastaan rakentavaa palautettasi!
+Olemme valinneet kaksi pedagogista periaatetta tätä opetussuunnitelmaa rakentaessamme: varmistaa, että se on projektipohjainen ja että se sisältää usein toistuvia testejä. Tämän sarjan lopussa opiskelijat ovat oppineet tietojenkäsittelytieteen perusperiaatteet, mukaan lukien eettiset käsitteet, datan valmistelun, erilaiset tavat työskennellä datan kanssa, datan visualisoinnin, data-analyysin, tietojenkäsittelytieteen tosielämän käyttötapaukset ja paljon muuta.
+Lisäksi matalan kynnyksen testi ennen oppituntia suuntaa opiskelijan huomion aiheen oppimiseen, kun taas toinen testi oppitunnin jälkeen varmistaa paremman tiedon säilymisen. Tämä opetussuunnitelma on suunniteltu joustavaksi ja hauskaksi, ja sen voi suorittaa kokonaan tai osittain. Projektit alkavat pienistä ja muuttuvat yhä monimutkaisemmiksi 10 viikon jakson loppua kohden.
+> Löydät [käytännesäännöt](CODE_OF_CONDUCT.md), [ohjeet osallistumiseen](CONTRIBUTING.md) ja [käännösohjeet](TRANSLATIONS.md). Otamme mielellämme vastaan rakentavaa palautettasi!
## Jokainen oppitunti sisältää:
-- Valinnainen sketchnote
+- Valinnainen luonnoskuva
- Valinnainen lisävideo
-- Ennakko-oppitunnin lämmittelevä testi
+- Lämmittelykysely ennen oppituntia
- Kirjallinen oppitunti
- Projektipohjaisissa oppitunneissa vaiheittaiset ohjeet projektin rakentamiseen
- Tietotarkistukset
- Haaste
- Lisälukemista
- Tehtävä
-- Jälkitesti
+- [Kysely oppitunnin jälkeen](https://ff-quizzes.netlify.app/en/)
-> **Huomio testeistä**: Kaikki testit löytyvät Quiz-App-kansiosta, yhteensä 40 testiä, joissa on kolme kysymystä kussakin. Ne on linkitetty oppitunneista, mutta testisovelluksen voi ajaa paikallisesti tai julkaista Azureen; seuraa ohjeita `quiz-app`-kansiossa. Testejä lokalisoidaan vähitellen.
+> **Huomio kyselyistä**: Kaikki kyselyt löytyvät Quiz-App-kansiosta, yhteensä 40 kyselyä, joissa on kolme kysymystä kussakin. Ne on linkitetty oppitunneista, mutta kyselysovellusta voi ajaa paikallisesti tai julkaista Azureen; seuraa ohjeita `quiz-app`-kansiossa. Kyselyitä lokalisoidaan vähitellen.
## Oppitunnit
-| ](./sketchnotes/00-Roadmap.png)|
+| ](./sketchnotes/00-Roadmap.png)|
|:---:|
-| Tietojenkäsittelytiede aloittelijoille: Reittikartta - _Sketchnote by [@nitya](https://twitter.com/nitya)_ |
+| Data Science For Beginners: Roadmap - _Luonnoskuva [@nitya](https://twitter.com/nitya)_ |
| Oppitunnin numero | Aihe | Oppituntiryhmä | Oppimistavoitteet | Linkitetty oppitunti | Kirjoittaja |
| :-----------: | :----------------------------------------: | :--------------------------------------------------: | :-----------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :---------------------------------------------------------------------: | :----: |
-| 01 | Tietojenkäsittelytieteen määrittely | [Johdanto](1-Introduction/README.md) | Opi tietojenkäsittelytieteen peruskäsitteet ja sen suhde tekoälyyn, koneoppimiseen ja big dataan. | [oppitunti](1-Introduction/01-defining-data-science/README.md) [video](https://youtu.be/beZ7Mb_oz9I) | [Dmitry](http://soshnikov.com) |
-| 02 | Tietojenkäsittelytieteen etiikka | [Johdanto](1-Introduction/README.md) | Tietoeettiset käsitteet, haasteet ja viitekehykset. | [oppitunti](1-Introduction/02-ethics/README.md) | [Nitya](https://twitter.com/nitya) |
+| 01 | Datatieteen määrittely | [Johdanto](1-Introduction/README.md) | Opettele datatieteen peruskäsitteet ja sen yhteys tekoälyyn, koneoppimiseen ja big dataan. | [oppitunti](1-Introduction/01-defining-data-science/README.md) [video](https://youtu.be/beZ7Mb_oz9I) | [Dmitry](http://soshnikov.com) |
+| 02 | Datatieteen etiikka | [Johdanto](1-Introduction/README.md) | Dataetiikan käsitteet, haasteet ja viitekehykset. | [oppitunti](1-Introduction/02-ethics/README.md) | [Nitya](https://twitter.com/nitya) |
| 03 | Datan määrittely | [Johdanto](1-Introduction/README.md) | Miten data luokitellaan ja sen yleiset lähteet. | [oppitunti](1-Introduction/03-defining-data/README.md) | [Jasmine](https://www.twitter.com/paladique) |
-| 04 | Johdatus tilastotieteeseen ja todennäköisyyksiin | [Johdanto](1-Introduction/README.md) | Tilastotieteen ja todennäköisyyksien matemaattiset tekniikat datan ymmärtämiseksi. | [oppitunti](1-Introduction/04-stats-and-probability/README.md) [video](https://youtu.be/Z5Zy85g4Yjw) | [Dmitry](http://soshnikov.com) |
-| 05 | Työskentely relaatiodatan kanssa | [Työskentely datan kanssa](2-Working-With-Data/README.md) | Johdatus relaatiodataan ja SQL:n (Structured Query Language) perusteisiin relaatiodatan tutkimisessa ja analysoinnissa. | [oppitunti](2-Working-With-Data/05-relational-databases/README.md) | [Christopher](https://www.twitter.com/geektrainer) | | |
-| 06 | Työskentely NoSQL-datan kanssa | [Työskentely datan kanssa](2-Working-With-Data/README.md) | Johdatus ei-relaatiodataan, sen eri tyyppeihin ja dokumenttitietokantojen tutkimisen ja analysoinnin perusteisiin. | [oppitunti](2-Working-With-Data/06-non-relational/README.md) | [Jasmine](https://twitter.com/paladique)|
-| 07 | Työskentely Pythonin kanssa | [Työskentely datan kanssa](2-Working-With-Data/README.md) | Pythonin perusteet datan tutkimiseen Pandas-kirjaston avulla. Suositellaan perustason ymmärrystä Python-ohjelmoinnista. | [oppitunti](2-Working-With-Data/07-python/README.md) [video](https://youtu.be/dZjWOGbsN4Y) | [Dmitry](http://soshnikov.com) |
-| 08 | Datan valmistelu | [Työskentely datan kanssa](2-Working-With-Data/README.md) | Aiheita datan puhdistamiseen ja muuntamiseen liittyvistä tekniikoista, joilla käsitellään puuttuvaa, epätarkkaa tai epätäydellistä dataa. | [oppitunti](2-Working-With-Data/08-data-preparation/README.md) | [Jasmine](https://www.twitter.com/paladique) |
-| 09 | Määrien visualisointi | [Datavisualisointi](3-Data-Visualization/README.md) | Opi käyttämään Matplotlibia lintudatan visualisointiin 🦆 | [oppitunti](3-Data-Visualization/09-visualization-quantities/README.md) | [Jen](https://twitter.com/jenlooper) |
-| 10 | Datan jakaumien visualisointi | [Datavisualisointi](3-Data-Visualization/README.md) | Havainnot ja trendit aikavälillä. | [oppitunti](3-Data-Visualization/10-visualization-distributions/README.md) | [Jen](https://twitter.com/jenlooper) |
-| 11 | Suhteellisten osuuksien visualisointi | [Datavisualisointi](3-Data-Visualization/README.md) | Diskreettien ja ryhmiteltyjen prosenttiosuuksien visualisointi. | [oppitunti](3-Data-Visualization/11-visualization-proportions/README.md) | [Jen](https://twitter.com/jenlooper) |
-| 12 | Suhteiden visualisointi | [Datavisualisointi](3-Data-Visualization/README.md) | Yhteyksien ja korrelaatioiden visualisointi datan joukkojen ja niiden muuttujien välillä. | [oppitunti](3-Data-Visualization/12-visualization-relationships/README.md) | [Jen](https://twitter.com/jenlooper) |
-| 13 | Merkitykselliset visualisoinnit | [Datavisualisointi](3-Data-Visualization/README.md) | Tekniikoita ja ohjeita, joiden avulla visualisoinneista tulee arvokkaita tehokkaaseen ongelmanratkaisuun ja oivalluksiin. | [oppitunti](3-Data-Visualization/13-meaningful-visualizations/README.md) | [Jen](https://twitter.com/jenlooper) |
-| 14 | Johdanto datatieteen elinkaareen | [Elinkaari](4-Data-Science-Lifecycle/README.md) | Johdanto datatieteen elinkaareen ja sen ensimmäiseen vaiheeseen: datan hankintaan ja uuttamiseen. | [oppitunti](4-Data-Science-Lifecycle/14-Introduction/README.md) | [Jasmine](https://twitter.com/paladique) |
-| 15 | Analysointi | [Elinkaari](4-Data-Science-Lifecycle/README.md) | Tämä datatieteen elinkaaren vaihe keskittyy datan analysointitekniikoihin. | [oppitunti](4-Data-Science-Lifecycle/15-analyzing/README.md) | [Jasmine](https://twitter.com/paladique) | | |
-| 16 | Viestintä | [Elinkaari](4-Data-Science-Lifecycle/README.md) | Tämä datatieteen elinkaaren vaihe keskittyy datasta saatujen oivallusten esittämiseen päätöksentekijöille ymmärrettävällä tavalla. | [oppitunti](4-Data-Science-Lifecycle/16-communication/README.md) | [Jalen](https://twitter.com/JalenMcG) | | |
-| 17 | Datatiede pilvessä | [Pilvidata](5-Data-Science-In-Cloud/README.md) | Tämä oppituntisarja esittelee datatieteen pilvessä ja sen hyödyt. | [oppitunti](5-Data-Science-In-Cloud/17-Introduction/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) ja [Maud](https://twitter.com/maudstweets) |
-| 18 | Datatiede pilvessä | [Pilvidata](5-Data-Science-In-Cloud/README.md) | Mallien kouluttaminen Low Code -työkaluilla. | [oppitunti](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) ja [Maud](https://twitter.com/maudstweets) |
-| 19 | Datatiede pilvessä | [Pilvidata](5-Data-Science-In-Cloud/README.md) | Mallien käyttöönotto Azure Machine Learning Studiossa. | [oppitunti](5-Data-Science-In-Cloud/19-Azure/README.md)| [Tiffany](https://twitter.com/TiffanySouterre) ja [Maud](https://twitter.com/maudstweets) |
-| 20 | Datatiede tosielämässä | [Tosielämässä](6-Data-Science-In-Wild/README.md) | Datatieteeseen perustuvat projektit tosielämässä. | [oppitunti](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [Nitya](https://twitter.com/nitya) |
+| 04 | Johdatus tilastotieteeseen ja todennäköisyyteen | [Johdanto](1-Introduction/README.md) | Todennäköisyyden ja tilastotieteen matemaattiset tekniikat datan ymmärtämiseksi. | [oppitunti](1-Introduction/04-stats-and-probability/README.md) [video](https://youtu.be/Z5Zy85g4Yjw) | [Dmitry](http://soshnikov.com) |
+| 05 | Työskentely relaatiodatan kanssa | [Työskentely datan kanssa](2-Working-With-Data/README.md) | Johdatus relaatiodataan ja perusteet relaatiodatan tutkimiseen ja analysointiin käyttäen SQL:ää (lausutaan "see-quell"). | [oppitunti](2-Working-With-Data/05-relational-databases/README.md) | [Christopher](https://www.twitter.com/geektrainer) | | |
+| 06 | Työskentely NoSQL-datan kanssa | [Työskentely datan kanssa](2-Working-With-Data/README.md) | Johdatus ei-relaatiodataan, sen eri tyyppeihin ja perusteet dokumenttitietokantojen tutkimiseen ja analysointiin. | [oppitunti](2-Working-With-Data/06-non-relational/README.md) | [Jasmine](https://twitter.com/paladique)|
+| 07 | Työskentely Pythonin kanssa | [Työskentely datan kanssa](2-Working-With-Data/README.md) | Pythonin käyttö datan tutkimiseen kirjastoilla, kuten Pandas. Perustiedot Python-ohjelmoinnista suositellaan. | [oppitunti](2-Working-With-Data/07-python/README.md) [video](https://youtu.be/dZjWOGbsN4Y) | [Dmitry](http://soshnikov.com) |
+| 08 | Datan valmistelu | [Työskentely datan kanssa](2-Working-With-Data/README.md) | Aiheita datan puhdistamisen ja muuntamisen tekniikoista, jotka auttavat käsittelemään puuttuvaa, epätarkkaa tai epätäydellistä dataa. | [oppitunti](2-Working-With-Data/08-data-preparation/README.md) | [Jasmine](https://www.twitter.com/paladique) |
+| 09 | Määrien visualisointi | [Datavisualisointi](3-Data-Visualization/README.md) | Opettele käyttämään Matplotlibia lintudatan visualisointiin 🦆 | [oppitunti](3-Data-Visualization/09-visualization-quantities/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 10 | Datan jakaumien visualisointi | [Datavisualisointi](3-Data-Visualization/README.md) | Havainnointien ja trendien visualisointi tietyllä aikavälillä. | [oppitunti](3-Data-Visualization/10-visualization-distributions/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 11 | Suhteiden visualisointi | [Datavisualisointi](3-Data-Visualization/README.md) | Yhteyksien ja korrelaatioiden visualisointi datan joukkojen ja niiden muuttujien välillä. | [oppitunti](3-Data-Visualization/12-visualization-relationships/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 12 | Merkitykselliset visualisoinnit | [Datavisualisointi](3-Data-Visualization/README.md) | Tekniikat ja ohjeet, joiden avulla visualisoinnit ovat arvokkaita tehokkaaseen ongelmanratkaisuun ja oivalluksiin. | [oppitunti](3-Data-Visualization/13-meaningful-visualizations/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 13 | Johdatus datatieteen elinkaareen | [Elinkaari](4-Data-Science-Lifecycle/README.md) | Johdatus datatieteen elinkaareen ja sen ensimmäiseen vaiheeseen, datan hankintaan ja uuttamiseen. | [oppitunti](4-Data-Science-Lifecycle/14-Introduction/README.md) | [Jasmine](https://twitter.com/paladique) |
+| 14 | Analysointi | [Elinkaari](4-Data-Science-Lifecycle/README.md) | Datatieteen elinkaaren vaihe, joka keskittyy datan analysointitekniikoihin. | [oppitunti](4-Data-Science-Lifecycle/15-analyzing/README.md) | [Jasmine](https://twitter.com/paladique) | | |
+| 15 | Viestintä | [Elinkaari](4-Data-Science-Lifecycle/README.md) | Datatieteen elinkaaren vaihe, joka keskittyy datasta saatujen oivallusten esittämiseen päätöksentekijöille ymmärrettävällä tavalla. | [oppitunti](4-Data-Science-Lifecycle/16-communication/README.md) | [Jalen](https://twitter.com/JalenMcG) | | |
+| 16 | Datatiede pilvessä | [Pilvidata](5-Data-Science-In-Cloud/README.md) | Tämä oppituntisarja esittelee datatieteen pilvessä ja sen hyödyt. | [oppitunti](5-Data-Science-In-Cloud/17-Introduction/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) ja [Maud](https://twitter.com/maudstweets) |
+| 17 | Datatiede pilvessä | [Pilvidata](5-Data-Science-In-Cloud/README.md) | Mallien kouluttaminen Low Code -työkaluilla. |[oppitunti](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) ja [Maud](https://twitter.com/maudstweets) |
+| 18 | Datatiede pilvessä | [Pilvidata](5-Data-Science-In-Cloud/README.md) | Mallien julkaiseminen Azure Machine Learning Studiossa. | [oppitunti](5-Data-Science-In-Cloud/19-Azure/README.md)| [Tiffany](https://twitter.com/TiffanySouterre) ja [Maud](https://twitter.com/maudstweets) |
+| 19 | Datatiede tosielämässä | [Tosielämässä](6-Data-Science-In-Wild/README.md) | Datatieteen ohjaamat projektit tosielämässä. | [oppitunti](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [Nitya](https://twitter.com/nitya) |
## GitHub Codespaces
-Noudata näitä ohjeita avataksesi tämän esimerkin Codespacessa:
+Seuraa näitä ohjeita avataksesi tämän esimerkin Codespacessa:
1. Klikkaa Code-pudotusvalikkoa ja valitse Open with Codespaces -vaihtoehto.
2. Valitse + New codespace paneelin alareunasta.
Lisätietoja löydät [GitHub-dokumentaatiosta](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace).
## VSCode Remote - Containers
-Noudata näitä ohjeita avataksesi tämän repositorion kontissa paikallisella koneellasi ja VSCode-ohjelmalla käyttäen VS Code Remote - Containers -laajennusta:
+Seuraa näitä ohjeita avataksesi tämän repositorion kontissa paikallisella koneellasi ja VSCode-ohjelmalla käyttäen VS Code Remote - Containers -laajennusta:
-1. Jos käytät kehityskonttia ensimmäistä kertaa, varmista, että järjestelmäsi täyttää ennakkovaatimukset (esim. Docker on asennettu) [aloitusdokumentaation](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started) mukaisesti.
+1. Jos käytät kehityskonttia ensimmäistä kertaa, varmista, että järjestelmäsi täyttää vaatimukset (esim. Docker on asennettu) [aloitusdokumentaation](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started) mukaisesti.
-Voit käyttää tätä repositoriota joko avaamalla sen eristetyssä Docker-volyymissä:
+Tätä repositoriota voi käyttää joko avaamalla sen eristetyssä Docker-volyymissa:
-**Huom**: Tämä käyttää taustalla Remote-Containers: **Clone Repository in Container Volume...** -komentoa kloonaamaan lähdekoodin Docker-volyymiin paikallisen tiedostojärjestelmän sijaan. [Volyymit](https://docs.docker.com/storage/volumes/) ovat suositeltu tapa säilyttää konttidataa.
+**Huomio**: Taustalla tämä käyttää Remote-Containers: **Clone Repository in Container Volume...** -komentoa kloonatakseen lähdekoodin Docker-volyymiin paikallisen tiedostojärjestelmän sijaan. [Volyymit](https://docs.docker.com/storage/volumes/) ovat suositeltu tapa säilyttää konttidata.
Tai avaamalla paikallisesti kloonatun tai ladatun version repositoriosta:
- Kloonaa tämä repositorio paikalliselle tiedostojärjestelmällesi.
- Paina F1 ja valitse **Remote-Containers: Open Folder in Container...** -komento.
-- Valitse kloonattu kansio, odota kontin käynnistymistä ja kokeile.
+- Valitse kloonattu kopio tästä kansiosta, odota konttia käynnistymään ja kokeile asioita.
## Offline-käyttö
-Voit käyttää tätä dokumentaatiota offline-tilassa käyttämällä [Docsifyä](https://docsify.js.org/#/). Haaroita tämä repositorio, [asenna Docsify](https://docsify.js.org/#/quickstart) paikalliselle koneellesi ja kirjoita tämän repositorion juurikansiossa `docsify serve`. Verkkosivusto palvelee portissa 3000 localhostissa: `localhost:3000`.
-
-> Huomaa, että Docsify ei renderöi muistikirjoja, joten kun tarvitset muistikirjan suorittamista, tee se erikseen VS Codessa Python-ytimellä.
-
-## Apua tarvitaan!
+Voit käyttää tätä dokumentaatiota offline-tilassa käyttämällä [Docsifyä](https://docsify.js.org/#/). Haaroita tämä repositorio, [asenna Docsify](https://docsify.js.org/#/quickstart) paikalliselle koneellesi, ja kirjoita tämän repositorion juurikansiossa `docsify serve`. Verkkosivusto palvelee portilla 3000 localhostissa: `localhost:3000`.
-Jos haluat kääntää koko tai osan oppimateriaalista, noudata [Käännökset](TRANSLATIONS.md) -ohjettamme.
+> Huomio, muistikirjoja ei renderöidä Docsifyllä, joten kun tarvitset muistikirjan käyttöä, tee se erikseen VS Codessa Python-ytimen avulla.
-## Muut oppimateriaalit
+## Muut opetussuunnitelmat
-Tiimimme tuottaa myös muita oppimateriaaleja! Tutustu:
+Tiimimme tuottaa muita opetussuunnitelmia! Tutustu:
- [Generative AI for Beginners](https://aka.ms/genai-beginners)
- [Generative AI for Beginners .NET](https://github.com/microsoft/Generative-AI-for-beginners-dotnet)
@@ -160,4 +150,4 @@ Tiimimme tuottaa myös muita oppimateriaaleja! Tutustu:
---
**Vastuuvapauslauseke**:
-Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua [Co-op Translator](https://github.com/Azure/co-op-translator). Vaikka pyrimme tarkkuuteen, huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäinen asiakirja sen alkuperäisellä kielellä tulisi pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskäännöstä. Emme ole vastuussa väärinkäsityksistä tai virhetulkinnoista, jotka johtuvat tämän käännöksen käytöstä.
\ No newline at end of file
+Tämä asiakirja on käännetty käyttämällä tekoälypohjaista käännöspalvelua [Co-op Translator](https://github.com/Azure/co-op-translator). Pyrimme tarkkuuteen, mutta huomioithan, että automaattiset käännökset voivat sisältää virheitä tai epätarkkuuksia. Alkuperäistä asiakirjaa sen alkuperäisellä kielellä tulee pitää ensisijaisena lähteenä. Kriittisen tiedon osalta suositellaan ammattimaista ihmiskääntämistä. Emme ole vastuussa väärinkäsityksistä tai virhetulkinnoista, jotka johtuvat tämän käännöksen käytöstä.
\ No newline at end of file
diff --git a/translations/he/1-Introduction/01-defining-data-science/README.md b/translations/he/1-Introduction/01-defining-data-science/README.md
new file mode 100644
index 00000000..9eacbbd4
--- /dev/null
+++ b/translations/he/1-Introduction/01-defining-data-science/README.md
@@ -0,0 +1,80 @@
+
+## סוגי נתונים
+
+כפי שכבר הזכרנו, נתונים נמצאים בכל מקום. אנחנו רק צריכים ללכוד אותם בצורה הנכונה! חשוב להבחין בין נתונים **מובנים** לנתונים **לא מובנים**. הראשונים מיוצגים בדרך כלל בצורה מסודרת, לעיתים קרובות כטבלה או מספר טבלאות, בעוד שהאחרונים הם פשוט אוסף של קבצים. לפעמים ניתן גם לדבר על נתונים **חצי-מובנים**, שיש להם סוג מסוים של מבנה שיכול להשתנות מאוד.
+
+| נתונים מובנים | נתונים חצי-מובנים | נתונים לא מובנים |
+| -------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------- | --------------------------------------- |
+| רשימת אנשים עם מספרי הטלפון שלהם | דפי ויקיפדיה עם קישורים | טקסט של אנציקלופדיה בריטניקה |
+| טמפרטורה בכל חדרי הבניין בכל דקה במשך 20 השנים האחרונות | אוסף מאמרים מדעיים בפורמט JSON עם מחברים, תאריך פרסום ותקציר | שיתוף קבצים עם מסמכים ארגוניים |
+| נתונים על גיל ומגדר של כל האנשים הנכנסים לבניין | דפי אינטרנט | וידאו גולמי ממצלמת אבטחה |
+
+## מאיפה להשיג נתונים
+
+ישנם מקורות רבים לנתונים, ולא ניתן למנות את כולם! עם זאת, נזכיר כמה מהמקומות הטיפוסיים שבהם ניתן להשיג נתונים:
+
+* **מובנים**
+ - **האינטרנט של הדברים** (IoT), כולל נתונים מחיישנים שונים, כמו חיישני טמפרטורה או לחץ, מספקים הרבה נתונים שימושיים. לדוגמה, אם בניין משרדים מצויד בחיישני IoT, ניתן לשלוט אוטומטית בחימום ובתאורה כדי למזער עלויות.
+ - **סקרים** שאנו מבקשים ממשתמשים למלא לאחר רכישה או לאחר ביקור באתר.
+ - **ניתוח התנהגות** יכול, למשל, לעזור לנו להבין עד כמה משתמש מעמיק באתר ומהי הסיבה הטיפוסית לעזיבתו.
+* **לא מובנים**
+ - **טקסטים** יכולים להיות מקור עשיר לתובנות, כמו ציון **תחושה כללית**, או חילוץ מילות מפתח ומשמעות סמנטית.
+ - **תמונות** או **וידאו**. וידאו ממצלמת אבטחה יכול לשמש להערכת עומסי תנועה בכביש ולהודיע לאנשים על פקקים אפשריים.
+ - **יומני שרת אינטרנט** יכולים לשמש להבנת אילו דפים באתר שלנו נצפים הכי הרבה זמן.
+* **חצי-מובנים**
+ - **גרפים של רשתות חברתיות** יכולים להיות מקורות מצוינים לנתונים על אישיות משתמשים ועל היעילות הפוטנציאלית בהפצת מידע.
+ - כאשר יש לנו אוסף של תמונות ממסיבה, נוכל לנסות לחלץ נתוני **דינמיקה קבוצתית** על ידי בניית גרף של אנשים המצטלמים יחד.
+
+על ידי הכרת מקורות הנתונים השונים, תוכלו לחשוב על תרחישים שונים שבהם ניתן ליישם טכניקות מדע נתונים כדי להבין את המצב טוב יותר ולשפר תהליכים עסקיים.
+
+## מה אפשר לעשות עם נתונים
+
+במדע הנתונים, אנו מתמקדים בשלבים הבאים במסע הנתונים:
+
+כמובן, בהתאם לנתונים בפועל, ייתכן שחלק מהשלבים ייחסרו (למשל, כאשר הנתונים כבר נמצאים בבסיס נתונים, או כאשר אין צורך באימון מודל), או שחלק מהשלבים יחזרו על עצמם מספר פעמים (כמו עיבוד נתונים).
+
+## דיגיטציה וטרנספורמציה דיגיטלית
+
+בעשור האחרון, עסקים רבים החלו להבין את חשיבות הנתונים בקבלת החלטות עסקיות. כדי ליישם עקרונות מדע נתונים בניהול עסק, יש קודם כל לאסוף נתונים, כלומר לתרגם תהליכים עסקיים לצורה דיגיטלית. זה נקרא **דיגיטציה**. יישום טכניקות מדע נתונים על נתונים אלו כדי להנחות החלטות יכול להוביל לעלייה משמעותית בפרודוקטיביות (או אפילו לשינוי כיוון עסקי), הנקרא **טרנספורמציה דיגיטלית**.
+
+בואו נבחן דוגמה. נניח שיש לנו קורס מדע נתונים (כמו זה) שאנו מעבירים לסטודנטים באופן מקוון, ואנו רוצים להשתמש במדע נתונים כדי לשפר אותו. איך נוכל לעשות זאת?
+
+נוכל להתחיל בשאלה "מה ניתן לדיגיטציה?" הדרך הפשוטה ביותר תהיה למדוד את הזמן שלוקח לכל סטודנט להשלים כל מודול, ולמדוד את הידע שהושג על ידי מתן מבחן רב-ברירה בסוף כל מודול. על ידי חישוב ממוצע זמן ההשלמה של כל הסטודנטים, נוכל לגלות אילו מודולים גורמים לקשיים הגדולים ביותר ולעבוד על פישוטם.
+אתה עשוי לטעון שהגישה הזו אינה אידיאלית, מכיוון שמודולים יכולים להיות באורכים שונים. כנראה שיותר הוגן לחלק את הזמן לפי אורך המודול (במספר התווים), ולהשוות את הערכים הללו במקום זאת.
+כאשר אנו מתחילים לנתח תוצאות של מבחנים עם שאלות רב-ברירה, אנו יכולים לנסות לזהות אילו מושגים קשה לתלמידים להבין, ולהשתמש במידע הזה כדי לשפר את התוכן. כדי לעשות זאת, עלינו לעצב מבחנים כך שכל שאלה תתאים למושג מסוים או ליחידת ידע מסוימת.
+
+אם נרצה להעמיק עוד יותר, נוכל לשרטט את הזמן שנדרש לכל מודול מול קטגוריית הגיל של התלמידים. ייתכן שנגלה שבחלק מקטגוריות הגיל לוקח זמן רב מדי לסיים את המודול, או שתלמידים נושרים לפני שהם מסיימים אותו. זה יכול לעזור לנו להציע המלצות גיל למודול, ולמזער את חוסר שביעות הרצון של אנשים מציפיות שגויות.
+
+## 🚀 אתגר
+
+באתגר הזה, ננסה למצוא מושגים רלוונטיים לתחום מדעי הנתונים על ידי ניתוח טקסטים. ניקח מאמר מוויקיפדיה על מדעי הנתונים, נוריד ונעבד את הטקסט, ואז נבנה ענן מילים כמו זה:
+
+
+
+בקרו ב-[`notebook.ipynb`](../../../../../../../../../1-Introduction/01-defining-data-science/notebook.ipynb ':ignore') כדי לעבור על הקוד. תוכלו גם להריץ את הקוד ולראות כיצד הוא מבצע את כל השינויים בנתונים בזמן אמת.
+
+> אם אינכם יודעים כיצד להריץ קוד ב-Jupyter Notebook, עיינו ב-[מאמר הזה](https://soshnikov.com/education/how-to-execute-notebooks-from-github/).
+
+## [שאלון לאחר ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/1)
+
+## משימות
+
+* **משימה 1**: שנו את הקוד למעלה כדי למצוא מושגים קשורים לתחומים של **ביג דאטה** ו-**למידת מכונה**
+* **משימה 2**: [חשבו על תרחישים במדעי הנתונים](assignment.md)
+
+## קרדיטים
+
+השיעור הזה נכתב באהבה ♥️ על ידי [דמיטרי סושניקוב](http://soshnikov.com)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/1-Introduction/01-defining-data-science/assignment.md b/translations/he/1-Introduction/01-defining-data-science/assignment.md
new file mode 100644
index 00000000..9ac4cb76
--- /dev/null
+++ b/translations/he/1-Introduction/01-defining-data-science/assignment.md
@@ -0,0 +1,46 @@
+
+# משימה: תרחישים במדעי הנתונים
+
+במשימה הראשונה הזו, אנו מבקשים ממך לחשוב על תהליך או בעיה אמיתית בתחומים שונים, וכיצד ניתן לשפר אותה באמצעות תהליך מדעי הנתונים. חשוב על הדברים הבאים:
+
+1. אילו נתונים ניתן לאסוף?
+1. כיצד היית אוסף אותם?
+1. כיצד היית מאחסן את הנתונים? מהו גודל הנתונים הצפוי?
+1. אילו תובנות ניתן להפיק מהנתונים הללו? אילו החלטות ניתן לקבל על בסיס הנתונים?
+
+נסה לחשוב על 3 בעיות/תהליכים שונים ותאר כל אחד מהנקודות לעיל עבור כל תחום בעיה.
+
+להלן כמה תחומי בעיות ודוגמאות שיכולים לעזור לך להתחיל לחשוב:
+
+1. כיצד ניתן להשתמש בנתונים כדי לשפר את תהליך החינוך לילדים בבתי ספר?
+1. כיצד ניתן להשתמש בנתונים כדי לשלוט בתהליך החיסונים במהלך מגפה?
+1. כיצד ניתן להשתמש בנתונים כדי לוודא שאתה פרודוקטיבי בעבודה?
+
+## הוראות
+
+מלא את הטבלה הבאה (החלף את תחומי הבעיות המוצעים בתחומים משלך אם יש צורך):
+
+| תחום בעיה | בעיה | אילו נתונים לאסוף | כיצד לאחסן את הנתונים | אילו תובנות/החלטות ניתן להפיק |
+|------------|-------|--------------------|------------------------|--------------------------------|
+| חינוך | | | | |
+| חיסונים | | | | |
+| פרודוקטיביות | | | | |
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | -- |
+הצליח לזהות מקורות נתונים סבירים, דרכים לאחסון נתונים והחלטות/תובנות אפשריות עבור כל תחומי הבעיות | חלק מההיבטים של הפתרון אינם מפורטים, אחסון נתונים לא נדון, לפחות 2 תחומי בעיות מתוארים | רק חלקים מהפתרון לנתונים מתוארים, רק תחום בעיה אחד נחשב.
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/1-Introduction/01-defining-data-science/solution/assignment.md b/translations/he/1-Introduction/01-defining-data-science/solution/assignment.md
new file mode 100644
index 00000000..8fa565c2
--- /dev/null
+++ b/translations/he/1-Introduction/01-defining-data-science/solution/assignment.md
@@ -0,0 +1,48 @@
+
+# משימה: תרחישים במדעי הנתונים
+
+במשימה הראשונה הזו, אנו מבקשים מכם לחשוב על תהליך או בעיה מהחיים האמיתיים בתחומים שונים, וכיצד ניתן לשפר אותם באמצעות תהליך מדעי הנתונים. חשבו על הדברים הבאים:
+
+1. אילו נתונים ניתן לאסוף?
+1. כיצד תאספו אותם?
+1. כיצד תאחסנו את הנתונים? מהו סדר הגודל של הנתונים?
+1. אילו תובנות ניתן להפיק מהנתונים? אילו החלטות נוכל לקבל על בסיס הנתונים?
+
+נסו לחשוב על 3 בעיות/תהליכים שונים ותארו כל אחד מהנקודות הנ"ל עבור כל תחום בעיה.
+
+להלן כמה תחומי בעיות ודוגמאות שיעזרו לכם להתחיל לחשוב:
+
+1. כיצד ניתן להשתמש בנתונים כדי לשפר את תהליך החינוך לילדים בבתי ספר?
+1. כיצד ניתן להשתמש בנתונים כדי לשלוט בתהליך החיסונים במהלך מגפה?
+1. כיצד ניתן להשתמש בנתונים כדי לוודא שאתם פרודוקטיביים בעבודה?
+
+## הוראות
+
+מלאו את הטבלה הבאה (החליפו את תחומי הבעיות המוצעים בתחומים משלכם אם יש צורך):
+
+| תחום הבעיה | הבעיה | אילו נתונים לאסוף | כיצד לאחסן את הנתונים | אילו תובנות/החלטות ניתן להפיק |
+|-------------|--------|--------------------|------------------------|---------------------------------|
+| חינוך | באוניברסיטה, בדרך כלל יש נוכחות נמוכה בהרצאות, ויש לנו את ההשערה שסטודנטים שנוכחים בהרצאות מצליחים יותר במבחנים. אנו רוצים לעודד נוכחות ולבדוק את ההשערה. | ניתן לעקוב אחר נוכחות באמצעות תמונות שצולמו על ידי מצלמות האבטחה בכיתה, או על ידי מעקב אחר כתובות Bluetooth/WiFi של טלפונים ניידים של סטודנטים בכיתה. נתוני מבחנים כבר זמינים במאגר האוניברסיטה. | במקרה של מעקב אחר תמונות ממצלמות האבטחה - נצטרך לאחסן כמה (5-10) תמונות במהלך השיעור (נתונים לא מובנים), ולאחר מכן להשתמש בבינה מלאכותית כדי לזהות את פניהם של הסטודנטים (להמיר את הנתונים לצורה מובנית). | נוכל לחשב נתוני נוכחות ממוצעים עבור כל סטודנט, ולבדוק אם יש קשר כלשהו עם ציוני המבחנים. נדבר יותר על קשרים ב[פרק הסתברות וסטטיסטיקה](../../04-stats-and-probability/README.md). כדי לעודד נוכחות סטודנטים, נוכל לפרסם את דירוג הנוכחות השבועי בפורטל האוניברסיטה, ולערוך הגרלות בין אלו עם הנוכחות הגבוהה ביותר. |
+| חיסונים | | | | |
+| פרודוקטיביות | | | | |
+
+> *אנו מספקים תשובה אחת כדוגמה, כדי שתוכלו להבין מה מצופה במשימה זו.*
+
+## קריטריונים להערכה
+
+מצוין | מספק | דורש שיפור
+--- | --- | -- |
+הצליחו לזהות מקורות נתונים סבירים, דרכים לאחסון נתונים והחלטות/תובנות אפשריות עבור כל תחומי הבעיות | חלק מהיבטי הפתרון אינם מפורטים, אחסון הנתונים לא נדון, לפחות 2 תחומי בעיות מתוארים | רק חלקים מהפתרון מתוארים, רק תחום בעיה אחד נחשב.
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/1-Introduction/02-ethics/README.md b/translations/he/1-Introduction/02-ethics/README.md
new file mode 100644
index 00000000..c3a3bee4
--- /dev/null
+++ b/translations/he/1-Introduction/02-ethics/README.md
@@ -0,0 +1,267 @@
+
+# מבוא לאתיקה של נתונים
+
+| ](../../sketchnotes/02-Ethics.png)|
+|:---:|
+| אתיקה במדעי הנתונים - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+---
+
+כולנו אזרחים של נתונים החיים בעולם מבוסס נתונים.
+
+מגמות השוק מראות שעד שנת 2022, אחת מתוך שלוש ארגונים גדולים תקנה ותמכור את הנתונים שלה דרך [שווקים ומרכזי מסחר](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/) מקוונים. בתור **מפתחי אפליקציות**, יהיה לנו קל וזול יותר לשלב תובנות מבוססות נתונים ואוטומציה מבוססת אלגוריתמים בחוויות היומיום של המשתמשים. אך ככל שהבינה המלאכותית הופכת לנפוצה, נצטרך גם להבין את הנזקים הפוטנציאליים הנגרמים מ[שימוש לרעה](https://www.youtube.com/watch?v=TQHs8SA1qpk) באלגוריתמים כאלה בקנה מידה רחב.
+
+מגמות נוספות מצביעות על כך שניצור ונצרוך מעל [180 זטה-בייטים](https://www.statista.com/statistics/871513/worldwide-data-created/) של נתונים עד שנת 2025. בתור **מדעני נתונים**, זה מעניק לנו רמות חסרות תקדים של גישה לנתונים אישיים. המשמעות היא שנוכל לבנות פרופילים התנהגותיים של משתמשים ולהשפיע על קבלת ההחלטות בדרכים שיוצרות [אשליה של בחירה חופשית](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice), תוך כדי דחיפת המשתמשים לתוצאות שאנחנו מעדיפים. זה גם מעלה שאלות רחבות יותר על פרטיות נתונים והגנה על משתמשים.
+
+אתיקה של נתונים היא כיום _מסגרת הכרחית_ למדעי הנתונים וההנדסה, המסייעת לנו למזער נזקים פוטנציאליים ותוצאות בלתי צפויות מפעולותינו מבוססות הנתונים. [מחזור ההייפ של גרטנר עבור AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) מזהה מגמות רלוונטיות באתיקה דיגיטלית, AI אחראי, וממשל AI כגורמים מרכזיים למגמות רחבות יותר סביב _דמוקרטיזציה_ ו_תיעוש_ של AI.
+
+
+
+בשיעור זה, נחקור את התחום המרתק של אתיקה של נתונים - החל ממושגים ואתגרים מרכזיים, דרך מחקרי מקרה ועד מושגים יישומיים כמו ממשל AI - המסייעים לבסס תרבות אתית בצוותים ובארגונים העובדים עם נתונים ו-AI.
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
+
+## הגדרות בסיסיות
+
+נתחיל בהבנת המונחים הבסיסיים.
+
+המילה "אתיקה" מגיעה מהמילה היוונית [ethikos](https://en.wikipedia.org/wiki/Ethics) (ושורשה "ethos") שמשמעותה _אופי או טבע מוסרי_.
+
+**אתיקה** עוסקת בערכים משותפים ועקרונות מוסריים שמנחים את התנהגותנו בחברה. אתיקה מבוססת לא על חוקים אלא על נורמות מקובלות של מה "נכון מול לא נכון". עם זאת, שיקולים אתיים יכולים להשפיע על יוזמות ממשל תאגידי ורגולציות ממשלתיות שיוצרות תמריצים נוספים לציות.
+
+**אתיקה של נתונים** היא [ענף חדש של אתיקה](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) שחוקר ומעריך בעיות מוסריות הקשורות ל_נתונים, אלגוריתמים ופרקטיקות נלוות_. כאן, **"נתונים"** מתמקדים בפעולות הקשורות ליצירה, רישום, אצירה, עיבוד, הפצה, שיתוף ושימוש; **"אלגוריתמים"** מתמקדים ב-AI, סוכנים, למידת מכונה ורובוטים; ו**"פרקטיקות"** מתמקדות בנושאים כמו חדשנות אחראית, תכנות, פריצה וקודי אתיקה.
+
+**אתיקה יישומית** היא [יישום מעשי של שיקולים מוסריים](https://en.wikipedia.org/wiki/Applied_ethics). זהו תהליך של חקירה פעילה של סוגיות אתיות בהקשר של _פעולות, מוצרים ותהליכים בעולם האמיתי_, ולקיחת צעדים מתקנים כדי להבטיח שהם נשארים מיושרים עם הערכים האתיים שהוגדרו.
+
+**תרבות אתית** עוסקת ב[_הפעלה_ של אתיקה יישומית](https://hbr.org/2019/05/how-to-design-an-ethical-organization) כדי להבטיח שהעקרונות והפרקטיקות האתיים שלנו מאומצים באופן עקבי וניתן להרחבה בכל רחבי הארגון. תרבויות אתיות מצליחות מגדירות עקרונות אתיים ברמת הארגון, מספקות תמריצים משמעותיים לציות, ומחזקות נורמות אתיות על ידי עידוד והגברת התנהגויות רצויות בכל רמות הארגון.
+
+## מושגי אתיקה
+
+בקטע זה נדון במושגים כמו **ערכים משותפים** (עקרונות) ו**אתגרים אתיים** (בעיות) באתיקה של נתונים - ונחקור **מחקרי מקרה** שיעזרו לכם להבין את המושגים הללו בהקשרים של העולם האמיתי.
+
+### 1. עקרונות אתיים
+
+כל אסטרטגיה של אתיקה של נתונים מתחילה בהגדרת _עקרונות אתיים_ - "ערכים משותפים" שמתארים התנהגויות מקובלות ומנחים פעולות תואמות בפרויקטים של נתונים ו-AI שלנו. ניתן להגדיר אותם ברמה האישית או הצוותית. עם זאת, רוב הארגונים הגדולים מגדירים אותם בהצהרת משימה או מסגרת של _AI אתי_ ברמת הארגון, ומיישמים אותם באופן עקבי בכל הצוותים.
+
+**דוגמה:** הצהרת המשימה של [AI אחראי](https://www.microsoft.com/en-us/ai/responsible-ai) של מיקרוסופט אומרת: _"אנחנו מחויבים לקידום AI מונחה עקרונות אתיים שמעמידים את האנשים במרכז"_ - ומזהה 6 עקרונות אתיים במסגרת הבאה:
+
+
+
+בואו נחקור בקצרה את העקרונות הללו. _שקיפות_ ו_אחריות_ הם ערכים יסודיים שעליהם נבנים עקרונות אחרים - אז נתחיל שם:
+
+* [**אחריות**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) הופכת את העוסקים בתחום ל_אחראים_ על פעולותיהם בתחום הנתונים וה-AI, ועל הציות לעקרונות האתיים הללו.
+* [**שקיפות**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) מבטיחה שפעולות הנתונים וה-AI יהיו _מובנות_ (ניתנות לפרשנות) למשתמשים, תוך הסבר על מה ולמה מאחורי ההחלטות.
+* [**הוגנות**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) - מתמקדת בהבטחת יחס _הוגן_ לכל האנשים, תוך התמודדות עם הטיות חברתיות-טכניות מערכתיות או סמיות בנתונים ובמערכות.
+* [**אמינות ובטיחות**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - מבטיחה ש-AI מתנהג _בעקביות_ עם ערכים מוגדרים, תוך מזעור נזקים פוטנציאליים או תוצאות בלתי צפויות.
+* [**פרטיות ואבטחה**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - עוסקת בהבנת שושלת הנתונים ובמתן _הגנה על פרטיות נתונים_ למשתמשים.
+* [**הכללה**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) - עוסקת בעיצוב פתרונות AI מתוך כוונה, והתאמתם למגוון רחב של _צרכים ויכולות אנושיות_.
+
+> 🚨 חשבו על מה יכולה להיות הצהרת המשימה של אתיקה של נתונים שלכם. חקרו מסגרות AI אתיות מארגונים אחרים - הנה דוגמאות מ-[IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), ו-[Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). אילו ערכים משותפים יש להם במשותף? כיצד עקרונות אלה קשורים למוצרי AI או לתעשייה שבה הם פועלים?
+
+### 2. אתגרים אתיים
+
+לאחר שהגדרנו עקרונות אתיים, השלב הבא הוא להעריך את פעולות הנתונים וה-AI שלנו כדי לראות אם הן מתיישרות עם הערכים המשותפים הללו. חשבו על הפעולות שלכם בשתי קטגוריות: _איסוף נתונים_ ו_עיצוב אלגוריתמים_.
+
+באיסוף נתונים, הפעולות יכללו ככל הנראה **נתונים אישיים** או מידע אישי מזהה (PII) עבור אנשים מזוהים. זה כולל [פריטים מגוונים של נתונים לא אישיים](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) שמזהים _ביחד_ אדם. אתגרים אתיים יכולים להיות קשורים ל_פרטיות נתונים_, _בעלות על נתונים_, ונושאים קשורים כמו _הסכמה מדעת_ ו_זכויות קניין רוחני_ של משתמשים.
+
+בעיצוב אלגוריתמים, הפעולות יכללו איסוף ואצירה של **מאגרי נתונים**, ואז שימוש בהם לאימון ופריסה של **מודלים נתונים** שמנבאים תוצאות או מבצעים אוטומציה של החלטות בהקשרים של העולם האמיתי. אתגרים אתיים יכולים לנבוע מ_הטיות במאגרי נתונים_, _בעיות איכות נתונים_, _חוסר הוגנות_, ו_ייצוג שגוי_ באלגוריתמים - כולל כמה נושאים שהם מערכתיים בטבעם.
+
+בשני המקרים, אתגרים אתיים מדגישים אזורים שבהם הפעולות שלנו עשויות להיתקל בקונפליקט עם הערכים המשותפים שלנו. כדי לזהות, למזער, למנוע או לבטל את החששות הללו - עלינו לשאול שאלות מוסריות "כן/לא" הקשורות לפעולותינו, ואז לנקוט צעדים מתקנים לפי הצורך. בואו נבחן כמה אתגרים אתיים והשאלות המוסריות שהם מעלים:
+
+#### 2.1 בעלות על נתונים
+
+איסוף נתונים כולל לעיתים קרובות נתונים אישיים שיכולים לזהות את נושאי הנתונים. [בעלות על נתונים](https://permission.io/blog/data-ownership) עוסקת ב_שליטה_ ו[_זכויות משתמשים_](https://permission.io/blog/data-ownership) הקשורות ליצירה, עיבוד והפצה של נתונים.
+
+השאלות המוסריות שעלינו לשאול הן:
+ * מי הבעלים של הנתונים? (משתמש או ארגון)
+ * אילו זכויות יש לנושאי הנתונים? (לדוגמה: גישה, מחיקה, ניידות)
+ * אילו זכויות יש לארגונים? (לדוגמה: תיקון ביקורות משתמשים מזיקות)
+
+#### 2.2 הסכמה מדעת
+
+[הסכמה מדעת](https://legaldictionary.net/informed-consent/) מגדירה את פעולת המשתמשים בהסכמה לפעולה (כמו איסוף נתונים) עם _הבנה מלאה_ של עובדות רלוונטיות כולל המטרה, הסיכונים הפוטנציאליים והחלופות.
+
+שאלות לחקור כאן הן:
+ * האם המשתמש (נושא הנתונים) נתן רשות לאיסוף ושימוש בנתונים?
+ * האם המשתמש הבין את המטרה שלשמה נאספו הנתונים?
+ * האם המשתמש הבין את הסיכונים הפוטנציאליים מהשתתפותו?
+
+#### 2.3 קניין רוחני
+
+[קניין רוחני](https://en.wikipedia.org/wiki/Intellectual_property) מתייחס ליצירות בלתי מוחשיות הנובעות מיוזמה אנושית, שעשויות _להיות בעלות ערך כלכלי_ לאנשים או עסקים.
+
+שאלות לחקור כאן הן:
+ * האם לנתונים שנאספו יש ערך כלכלי למשתמש או לעסק?
+ * האם ל**משתמש** יש קניין רוחני כאן?
+ * האם ל**ארגון** יש קניין רוחני כאן?
+ * אם זכויות אלו קיימות, כיצד אנו מגנים עליהן?
+
+#### 2.4 פרטיות נתונים
+
+[פרטיות נתונים](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) או פרטיות מידע מתייחסת לשמירה על פרטיות המשתמש והגנה על זהותו ביחס למידע אישי מזהה.
+
+שאלות לחקור כאן הן:
+ * האם הנתונים האישיים של המשתמשים מוגנים מפני פריצות ודליפות?
+ * האם הנתונים של המשתמשים נגישים רק למשתמשים מורשים והקשרים מורשים?
+ * האם האנונימיות של המשתמשים נשמרת כאשר הנתונים משותפים או מופצים?
+ * האם ניתן לזהות משתמש מתוך מאגרי נתונים אנונימיים?
+
+#### 2.5 הזכות להישכח
+
+[הזכות להישכח](https://en.wikipedia.org/wiki/Right_to_be_forgotten) או [הזכות למחיקה](https://www.gdpreu.org/right-to-be-forgotten/) מספקת הגנה נוספת על נתונים אישיים למשתמשים. באופן ספציפי, היא מעניקה למשתמשים את הזכות לבקש מחיקה או הסרה של נתונים אישיים מחיפושים באינטרנט וממקומות אחרים, _בתנאים מסוימים_ - ומאפשרת להם התחלה חדשה ברשת מבלי שפעולות עבר יעמדו נגדם.
+
+שאלות לחקור כאן הן:
+ * האם המערכת מאפשרת לנושאי נתונים לבקש מחיקה?
+ * האם ביטול הסכמת המשתמש צריך להפעיל מחיקה אוטומטית?
+ * האם נתונים נאספו ללא הסכמה או באמצעים בלתי חוקיים?
+ * האם אנו עומדים ברגולציות ממשלתיות לפרטיות נתונים?
+
+#### 2.6 הטיות במאגרי נתונים
+
+הטיות במאגרי נתונים או [הטיות באיסוף](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) עוסקות בבחירת תת-קבוצה _לא מייצגת_ של נתונים לפיתוח אלגוריתמים, מה שיוצר פוטנציאל לחוסר הוגנות בתוצאות עבור קבוצות מגוונות. סוגי הטיות כוללים הטיית בחירה או דגימה, הטיית מתנדבים והטיית מכשירים.
+
+שאלות לחקור כאן הן:
+ * האם גייסנו קבוצה מייצגת של נושאי נתונים?
+ * האם בדקנו את מאגר הנתונים שנאסף או נאצר עבור הטיות שונות?
+ * האם אנו יכולים למזער או להסיר הטיות שהתגלו?
+
+#### 2.7 איכות נתונים
+
+[איכות נתונים](https://lakefs.io/data-quality-testing/) בוחנת את תקפות מאגר הנתונים שנאצר לפיתוח האלגוריתמים שלנו, ובודקת אם התכונות והרשומות עומדות בדרישות לרמת דיוק ועקביות הנדרשת למטרת ה-AI שלנו.
+
+שאלות לחקור כאן הן:
+ * האם אספנו תכונות _תקפות_ למקרה השימוש שלנו?
+ * האם הנתונים נאספו _בעקביות_ ממקורות נתונים מגוונים?
+ * האם מאגר הנתונים _שלם_ עבור תנאים או תרחישים מגוונים?
+ * האם המידע שנאסף _מדויק_ ומשקף את המציאות?
+
+#### 2.8 הוגנות אלגוריתמים
+[Algorithm Fairness](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) בודק האם עיצוב האלגוריתם מפלה באופן שיטתי נגד קבוצות משנה מסוימות של נבדקים, מה שמוביל ל[נזקים פוטנציאליים](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) ב_הקצאה_ (כאשר משאבים נשללים או נמנעים מאותה קבוצה) וב_איכות השירות_ (כאשר הבינה המלאכותית אינה מדויקת באותה מידה עבור קבוצות משנה מסוימות כמו שהיא עבור אחרות).
+
+שאלות שכדאי לבחון כאן:
+ * האם הערכנו את דיוק המודל עבור קבוצות משנה ותנאים מגוונים?
+ * האם בדקנו את המערכת לנזקים פוטנציאליים (לדוגמה, סטריאוטיפים)?
+ * האם ניתן לשנות נתונים או לאמן מחדש מודלים כדי להפחית נזקים שזוהו?
+
+חקור משאבים כמו [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) כדי ללמוד עוד.
+
+#### 2.9 ייצוג שגוי
+
+[ייצוג שגוי של נתונים](https://www.sciencedirect.com/topics/computer-science/misrepresentation) עוסק בשאלה האם אנו מתקשרים תובנות מנתונים שדווחו בכנות באופן מטעה כדי לתמוך בנרטיב רצוי.
+
+שאלות שכדאי לבחון כאן:
+ * האם אנו מדווחים נתונים לא שלמים או לא מדויקים?
+ * האם אנו מציגים נתונים באופן שמוביל למסקנות מטעות?
+ * האם אנו משתמשים בטכניקות סטטיסטיות סלקטיביות כדי לעוות תוצאות?
+ * האם קיימות הסברים חלופיים שיכולים להציע מסקנה שונה?
+
+#### 2.10 בחירה חופשית
+[אשליית הבחירה החופשית](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) מתרחשת כאשר "ארכיטקטורות בחירה" של מערכת משתמשות באלגוריתמים לקבלת החלטות כדי להניע אנשים לקחת תוצאה מועדפת תוך יצירת רושם שיש להם אפשרויות ושליטה. [דפוסים אפלים](https://www.darkpatterns.org/) אלו יכולים לגרום לנזקים חברתיים וכלכליים למשתמשים. מכיוון שהחלטות משתמש משפיעות על פרופילי התנהגות, פעולות אלו עשויות להניע בחירות עתידיות שיכולות להעצים או להרחיב את השפעת הנזקים הללו.
+
+שאלות שכדאי לבחון כאן:
+ * האם המשתמש הבין את ההשלכות של קבלת הבחירה הזו?
+ * האם המשתמש היה מודע לבחירות (חלופיות) וליתרונות וחסרונות של כל אחת?
+ * האם המשתמש יכול להפוך בחירה אוטומטית או מושפעת מאוחר יותר?
+
+### 3. מחקרי מקרה
+
+כדי לשים את האתגרים האתיים הללו בהקשרים של העולם האמיתי, כדאי להסתכל על מחקרי מקרה שמדגישים את הנזקים וההשלכות הפוטנציאליים על יחידים וחברה, כאשר הפרות אתיות כאלה מתעלמים מהן.
+
+הנה כמה דוגמאות:
+
+| אתגר אתי | מחקר מקרה |
+|--- |--- |
+| **הסכמה מדעת** | 1972 - [מחקר העגבת בטסקיגי](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - גברים אפרו-אמריקאים שהשתתפו במחקר הובטחה להם טיפול רפואי חינם _אך הוטעו_ על ידי חוקרים שלא יידעו את הנבדקים על האבחנה שלהם או על זמינות הטיפול. רבים מהנבדקים מתו, ושותפים או ילדים הושפעו; המחקר נמשך 40 שנה. |
+| **פרטיות נתונים** | 2007 - [פרס נתוני נטפליקס](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) סיפק לחוקרים _10 מיליון דירוגי סרטים אנונימיים מ-50 אלף לקוחות_ כדי לעזור לשפר אלגוריתמי המלצות. עם זאת, חוקרים הצליחו לקשר נתונים אנונימיים לנתונים מזהים אישית ב_מאגרי נתונים חיצוניים_ (לדוגמה, תגובות IMDb) - למעשה "דה-אנונימיזציה" של חלק ממנויי נטפליקס.|
+| **הטיה באיסוף נתונים** | 2013 - עיריית בוסטון [פיתחה את Street Bump](https://www.boston.gov/transportation/street-bump), אפליקציה שאפשרה לאזרחים לדווח על בורות, מה שנתן לעיר נתוני כבישים טובים יותר כדי למצוא ולתקן בעיות. עם זאת, [לאנשים בקבוצות הכנסה נמוכה הייתה פחות גישה למכוניות וטלפונים](https://hbr.org/2013/04/the-hidden-biases-in-big-data), מה שהפך את בעיות הכבישים שלהם לבלתי נראות באפליקציה זו. מפתחים עבדו עם אקדמאים כדי לטפל ב_נושאי גישה שוויונית ופערים דיגיטליים_ למען הוגנות. |
+| **הוגנות אלגוריתמית** | 2018 - מחקר [Gender Shades של MIT](http://gendershades.org/overview.html) העריך את דיוק מוצרי AI לסיווג מגדר, וחשף פערים בדיוק עבור נשים ואנשים בעלי צבע עור כהה. [כרטיס האשראי של אפל](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) משנת 2019 נראה שהציע פחות אשראי לנשים מאשר לגברים. שניהם הדגימו בעיות בהטיה אלגוריתמית שהובילה לנזקים חברתיים-כלכליים.|
+| **ייצוג שגוי של נתונים** | 2020 - [משרד הבריאות של ג'ורג'יה פרסם גרפים של מקרי COVID-19](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) שנראה כי הטעו אזרחים לגבי מגמות במקרים מאושרים עם סדר לא כרונולוגי על ציר ה-x. זה מדגים ייצוג שגוי באמצעות טריקים ויזואליים. |
+| **אשליית הבחירה החופשית** | 2020 - אפליקציית הלמידה [ABCmouse שילמה 10 מיליון דולר כדי ליישב תלונה של ה-FTC](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) שבה הורים נלכדו בתשלום עבור מנויים שהם לא יכלו לבטל. זה מדגים דפוסים אפלים בארכיטקטורות בחירה, שבהן משתמשים הונעו לעבר בחירות שעלולות להזיק. |
+| **פרטיות נתונים וזכויות משתמש** | 2021 - [פרצת נתונים בפייסבוק](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) חשפה נתונים מ-530 מיליון משתמשים, מה שהוביל להסדר של 5 מיליארד דולר עם ה-FTC. עם זאת, החברה סירבה להודיע למשתמשים על הפרצה, מה שהפר את זכויות המשתמשים בנוגע לשקיפות נתונים וגישה. |
+
+רוצה לחקור עוד מחקרי מקרה? בדוק את המשאבים הבאים:
+* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - דילמות אתיות בתעשיות מגוונות.
+* [קורס אתיקה במדעי הנתונים](https://www.coursera.org/learn/data-science-ethics#syllabus) - מחקרי מקרה מרכזיים נבחנים.
+* [מקרים שבהם דברים השתבשו](https://deon.drivendata.org/examples/) - רשימת בדיקות של דיאון עם דוגמאות.
+
+> 🚨 חשבו על מחקרי המקרה שראיתם - האם חוויתם או הושפעתם מאתגר אתי דומה בחייכם? האם אתם יכולים לחשוב על לפחות מחקר מקרה אחד נוסף שממחיש אחד מהאתגרים האתיים שדנו בהם בסעיף זה?
+
+## אתיקה יישומית
+
+דיברנו על מושגי אתיקה, אתגרים ומחקרי מקרה בהקשרים של העולם האמיתי. אבל איך מתחילים _ליישם_ עקרונות ושיטות אתיים בפרויקטים שלנו? ואיך _מפעילים_ את השיטות הללו למען ממשל טוב יותר? בואו נחקור כמה פתרונות בעולם האמיתי:
+
+### 1. קודים מקצועיים
+
+קודים מקצועיים מציעים אפשרות אחת לארגונים "לתמרץ" חברים לתמוך בעקרונות האתיים שלהם ובהצהרת המשימה. קודים הם _הנחיות מוסריות_ להתנהגות מקצועית, שעוזרות לעובדים או חברים לקבל החלטות שמתיישרות עם עקרונות הארגון שלהם. הם טובים רק כמו הציות מרצון מצד החברים; עם זאת, ארגונים רבים מציעים תגמולים ועונשים נוספים כדי להניע ציות מצד החברים.
+
+דוגמאות כוללות:
+
+ * [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
+ * [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (נוצר ב-2013)
+ * [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (מאז 1993)
+
+> 🚨 האם אתם חברים בארגון מקצועי להנדסה או מדעי הנתונים? חקרו את האתר שלהם כדי לראות אם הם מגדירים קוד אתיקה מקצועי. מה זה אומר על העקרונות האתיים שלהם? איך הם "מתמרצים" חברים לעקוב אחרי הקוד?
+
+### 2. רשימות בדיקה אתיות
+
+בעוד שקודים מקצועיים מגדירים _התנהגות אתית_ נדרשת מצד העוסקים בתחום, הם [מוגבלים ידועים](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) באכיפה, במיוחד בפרויקטים רחבי היקף. במקום זאת, מומחי מדעי הנתונים רבים [ממליצים על רשימות בדיקה](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), שיכולות **לחבר עקרונות לשיטות** בדרכים יותר דטרמיניסטיות וניתנות לפעולה.
+
+רשימות בדיקה ממירות שאלות למשימות "כן/לא" שניתן להפעיל, ומאפשרות לעקוב אחריהן כחלק מזרימות עבודה סטנדרטיות לשחרור מוצרים.
+
+דוגמאות כוללות:
+ * [Deon](https://deon.drivendata.org/) - רשימת בדיקה כללית לאתיקה במדעי הנתונים שנוצרה מ[המלצות תעשייה](https://deon.drivendata.org/#checklist-citations) עם כלי שורת פקודה לשילוב קל.
+ * [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - מספקת הנחיות כלליות לשיטות טיפול במידע מנקודות מבט משפטיות וחברתיות.
+ * [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - נוצרה על ידי מומחי AI כדי לתמוך באימוץ ושילוב בדיקות הוגנות במחזורי פיתוח AI.
+ * [22 שאלות לאתיקה במדעי הנתונים ובינה מלאכותית](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - מסגרת פתוחה יותר, מובנית לחקירה ראשונית של סוגיות אתיות בעיצוב, יישום והקשרים ארגוניים.
+
+### 3. רגולציות אתיות
+
+אתיקה עוסקת בהגדרת ערכים משותפים ועשיית הדבר הנכון _מרצון_. **ציות** עוסק ב_עמידה בחוק_ אם וכאשר מוגדר. **ממשל** מכסה באופן רחב את כל הדרכים שבהן ארגונים פועלים כדי לאכוף עקרונות אתיים ולעמוד בחוקים שנקבעו.
+
+כיום, ממשל לובש שתי צורות בתוך ארגונים. ראשית, מדובר בהגדרת עקרונות **AI אתיים** וביסוס שיטות להפעלת אימוץ בכל הפרויקטים הקשורים ל-AI בארגון. שנית, מדובר בעמידה בכל **רגולציות הגנת נתונים** שהממשלה מחייבת עבור האזורים שבהם היא פועלת.
+
+דוגמאות לרגולציות הגנת נתונים ופרטיות:
+
+ * `1974`, [חוק הפרטיות בארה"ב](https://www.justice.gov/opcl/privacy-act-1974) - מסדיר את איסוף, השימוש והגילוי של מידע אישי על ידי _הממשלה הפדרלית_.
+ * `1996`, [חוק הניידות והאחריות של ביטוח בריאות בארה"ב (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - מגן על נתוני בריאות אישיים.
+ * `1998`, [חוק הגנת פרטיות ילדים באינטרנט בארה"ב (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - מגן על פרטיות נתונים של ילדים מתחת לגיל 13.
+ * `2018`, [רגולציית הגנת נתונים כללית (GDPR)](https://gdpr-info.eu/) - מספקת זכויות משתמש, הגנת נתונים ופרטיות.
+ * `2018`, [חוק פרטיות הצרכן של קליפורניה (CCPA)](https://www.oag.ca.gov/privacy/ccpa) מעניק לצרכנים יותר _זכויות_ על הנתונים האישיים שלהם.
+ * `2021`, חוק [הגנת מידע אישי של סין](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) שנחקק לאחרונה, יוצר אחת הרגולציות החזקות ביותר לפרטיות נתונים באינטרנט בעולם.
+
+> 🚨 האיחוד האירופי הגדיר את GDPR (רגולציית הגנת נתונים כללית) שנשארת אחת הרגולציות המשפיעות ביותר לפרטיות נתונים כיום. האם ידעתם שהיא גם מגדירה [8 זכויות משתמש](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) כדי להגן על פרטיות דיגיטלית ונתונים אישיים של אזרחים? למדו על מה הן, ולמה הן חשובות.
+
+### 4. תרבות אתית
+
+שימו לב שקיים פער בלתי מוחשי בין _ציות_ (עשיית מספיק כדי לעמוד "באות החוק") לבין טיפול ב[בעיות מערכתיות](https://www.coursera.org/learn/data-science-ethics/home/week/4) (כמו אוסיפיקציה, אסימטריה מידעית ואי-צדק חלוקתי) שיכולות להאיץ את השימוש לרעה ב-AI.
+
+האחרון דורש [גישות שיתופיות להגדרת תרבויות אתיות](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) שבונות קשרים רגשיים וערכים משותפים עקביים _בין ארגונים_ בתעשייה. זה קורא ליותר [תרבויות אתיות פורמליות](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) בארגונים - שמאפשרות _לכל אחד_ [למשוך את חוט אנדון](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (כדי להעלות חששות אתיים מוקדם בתהליך) ועושות _הערכות אתיות_ (לדוגמה, בגיוס עובדים) קריטריון מרכזי להרכבת צוותים בפרויקטים של AI.
+
+---
+## [שאלון לאחר ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
+## סקירה ולימוד עצמי
+
+קורסים וספרים עוזרים להבין מושגי אתיקה מרכזיים ואתגרים, בעוד שמחקרי מקרה וכלים עוזרים עם שיטות אתיקה יישומיות בהקשרים של העולם האמיתי. הנה כמה משאבים להתחיל איתם.
+
+* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - שיעור על הוגנות, ממיקרוסופט.
+* [עקרונות הבינה המלאכותית האחראית](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - מסלול לימוד חינמי מ-Microsoft Learn.
+* [אתיקה ומדעי הנתונים](https://resources.oreilly.com/examples/0636920203964) - ספר אלקטרוני של O'Reilly (מ. לוקיידס, ה. מייסון ואחרים).
+* [אתיקה במדעי הנתונים](https://www.coursera.org/learn/data-science-ethics#syllabus) - קורס מקוון מאוניברסיטת מישיגן.
+* [אתיקה ללא כיסוי](https://ethicsunwrapped.utexas.edu/case-studies) - מחקרי מקרה מאוניברסיטת טקסס.
+
+# משימה
+
+[כתיבת מחקר מקרה בנושא אתיקה בנתונים](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/1-Introduction/02-ethics/assignment.md b/translations/he/1-Introduction/02-ethics/assignment.md
new file mode 100644
index 00000000..15bac700
--- /dev/null
+++ b/translations/he/1-Introduction/02-ethics/assignment.md
@@ -0,0 +1,35 @@
+
+## כתיבת מחקר מקרה על אתיקה בנתונים
+
+## הוראות
+
+למדתם על [אתגרים באתיקה בנתונים](README.md#2-ethics-challenges) וראיתם דוגמאות של [מחקרי מקרה](README.md#3-case-studies) המשקפים אתגרים באתיקה בנתונים בהקשרים מהעולם האמיתי.
+
+במטלה זו, תכתבו מחקר מקרה משלכם המשקף אתגר באתיקה בנתונים מתוך הניסיון האישי שלכם, או מתוך הקשר רלוונטי מהעולם האמיתי שאתם מכירים. פשוט עקבו אחר השלבים הבאים:
+
+1. `בחרו אתגר באתיקה בנתונים`. עיינו ב-[דוגמאות מהשיעור](README.md#2-ethics-challenges) או חפשו דוגמאות באינטרנט כמו [רשימת הבדיקה של Deon](https://deon.drivendata.org/examples/) לקבלת השראה.
+
+2. `תארו דוגמה מהעולם האמיתי`. חשבו על מצב ששמעתם עליו (כותרות, מחקר וכו') או שחוויתם (קהילה מקומית), שבו התרחש האתגר הספציפי הזה. חשבו על השאלות האתיות הקשורות לאתגר - ודונו בנזקים הפוטנציאליים או בתוצאות הבלתי מכוונות שנובעות מהנושא הזה. נקודות בונוס: חשבו על פתרונות פוטנציאליים או תהליכים שניתן ליישם כאן כדי לעזור למנוע או לצמצם את ההשפעה השלילית של האתגר הזה.
+
+3. `ספקו רשימת משאבים קשורים`. שתפו משאב אחד או יותר (קישורים למאמר, פוסט אישי בבלוג או תמונה, מאמר מחקר מקוון וכו') כדי להוכיח שזהו אירוע אמיתי מהעולם. נקודות בונוס: שתפו משאבים שמציגים גם את הנזקים והתוצאות הפוטנציאליים מהאירוע, או שמדגישים צעדים חיוביים שננקטו כדי למנוע את הישנותו.
+
+
+
+## קריטריונים להערכה
+
+מצוין | מספק | דורש שיפור
+--- | --- | -- |
+זוהו אתגר אחד או יותר באתיקה בנתונים.
מחקר המקרה מתאר בבירור אירוע מהעולם האמיתי המשקף את האתגר, ומדגיש את התוצאות הלא רצויות או הנזקים שנגרמו.
יש לפחות משאב מקושר אחד להוכחת האירוע. | זוהה אתגר אחד באתיקה בנתונים.
לפחות נזק או תוצאה רלוונטיים אחד נדונו בקצרה.
עם זאת, הדיון מוגבל או חסר הוכחה לאירוע מהעולם האמיתי. | זוהה אתגר בנתונים.
עם זאת, התיאור או המשאבים אינם משקפים כראוי את האתגר או מוכיחים את קיומו בעולם האמיתי. |
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/1-Introduction/03-defining-data/README.md b/translations/he/1-Introduction/03-defining-data/README.md
new file mode 100644
index 00000000..3923d0c2
--- /dev/null
+++ b/translations/he/1-Introduction/03-defining-data/README.md
@@ -0,0 +1,84 @@
+
+# הגדרת נתונים
+
+| ](../../sketchnotes/03-DefiningData.png)|
+|:---:|
+|הגדרת נתונים - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+נתונים הם עובדות, מידע, תצפיות ומדידות שמשמשים לגילויים ולתמיכה בהחלטות מושכלות. נקודת נתונים היא יחידה אחת של נתונים בתוך מערך נתונים, שהוא אוסף של נקודות נתונים. מערכי נתונים יכולים להגיע בפורמטים ובמבנים שונים, ובדרך כלל יתבססו על המקור שלהם, או על המקום שממנו הגיעו הנתונים. לדוגמה, רווחים חודשיים של חברה עשויים להיות בגיליון אלקטרוני, אך נתוני דופק לפי שעה משעון חכם עשויים להיות בפורמט [JSON](https://stackoverflow.com/a/383699). זה נפוץ שמדעני נתונים עובדים עם סוגים שונים של נתונים בתוך מערך נתונים.
+
+השיעור הזה מתמקד בזיהוי וסיווג נתונים לפי מאפייניהם ומקורותיהם.
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/4)
+## איך נתונים מתוארים
+
+### נתונים גולמיים
+נתונים גולמיים הם נתונים שהגיעו ממקורם במצבם הראשוני ולא נותחו או אורגנו. כדי להבין מה קורה עם מערך נתונים, יש לארגן אותו בפורמט שניתן להבין על ידי בני אדם וגם על ידי הטכנולוגיה שהם עשויים להשתמש בה לניתוח נוסף. המבנה של מערך נתונים מתאר איך הוא מאורגן וניתן לסווג אותו כמאורגן, לא מאורגן וחצי מאורגן. סוגי המבנה הללו ישתנו בהתאם למקור, אך בסופו של דבר יתאימו לשלוש הקטגוריות הללו.
+
+### נתונים כמותיים
+נתונים כמותיים הם תצפיות מספריות בתוך מערך נתונים וניתן בדרך כלל לנתח, למדוד ולהשתמש בהם מתמטית. כמה דוגמאות לנתונים כמותיים הם: אוכלוסיית מדינה, גובה של אדם או רווחים רבעוניים של חברה. עם ניתוח נוסף, נתונים כמותיים יכולים לשמש לגילוי מגמות עונתיות במדד איכות האוויר (AQI) או להערכת הסבירות של עומסי תנועה בשעות השיא ביום עבודה טיפוסי.
+
+### נתונים איכותיים
+נתונים איכותיים, הידועים גם כנתונים קטגוריים, הם נתונים שלא ניתן למדוד באופן אובייקטיבי כמו תצפיות של נתונים כמותיים. בדרך כלל מדובר בפורמטים שונים של נתונים סובייקטיביים שמלכדים את האיכות של משהו, כמו מוצר או תהליך. לפעמים, נתונים איכותיים הם מספריים אך לא ישמשו בדרך כלל מתמטית, כמו מספרי טלפון או חותמות זמן. כמה דוגמאות לנתונים איכותיים הם: תגובות לסרטונים, סוג ודגם של רכב או הצבע האהוב על החברים הקרובים שלך. נתונים איכותיים יכולים לשמש להבנת אילו מוצרים צרכנים אוהבים יותר או לזיהוי מילות מפתח פופולריות בקורות חיים של מועמדים לעבודה.
+
+### נתונים מאורגנים
+נתונים מאורגנים הם נתונים שמאורגנים לשורות ועמודות, כאשר לכל שורה יש את אותו סט של עמודות. עמודות מייצגות ערך מסוג מסוים ויהיו מזוהות עם שם שמתאר מה הערך מייצג, בעוד שורות מכילות את הערכים בפועל. לעמודות יהיו לעיתים קרובות סט ספציפי של כללים או הגבלות על הערכים, כדי להבטיח שהערכים מייצגים באופן מדויק את העמודה. לדוגמה, דמיינו גיליון אלקטרוני של לקוחות שבו לכל שורה חייב להיות מספר טלפון ומספרי הטלפון לעולם לא מכילים תווים אלפביתיים. ייתכן שיהיו כללים שיוחלו על עמודת מספר הטלפון כדי לוודא שהיא לעולם לא ריקה ומכילה רק מספרים.
+
+יתרון של נתונים מאורגנים הוא שניתן לארגן אותם בצורה כזו שניתן לקשר אותם לנתונים מאורגנים אחרים. עם זאת, מכיוון שהנתונים מעוצבים להיות מאורגנים בצורה ספציפית, ביצוע שינויים במבנה הכללי שלהם יכול לדרוש מאמץ רב. לדוגמה, הוספת עמודת דוא"ל לגיליון הלקוחות שלא יכולה להיות ריקה פירושה שתצטרכו להבין איך להוסיף את הערכים הללו לשורות הקיימות של לקוחות במערך הנתונים.
+
+דוגמאות לנתונים מאורגנים: גיליונות אלקטרוניים, מסדי נתונים יחסיים, מספרי טלפון, דפי חשבון בנק.
+
+### נתונים לא מאורגנים
+נתונים לא מאורגנים בדרך כלל לא יכולים להיות מסווגים לשורות או עמודות ולא מכילים פורמט או סט של כללים לעקוב אחריהם. מכיוון שלנתונים לא מאורגנים יש פחות הגבלות על המבנה שלהם, קל יותר להוסיף מידע חדש בהשוואה למערך נתונים מאורגן. אם חיישן שמקליט נתונים על לחץ ברומטרי כל 2 דקות קיבל עדכון שמאפשר לו למדוד ולהקליט טמפרטורה, אין צורך לשנות את הנתונים הקיימים אם הם לא מאורגנים. עם זאת, זה עשוי לגרום לניתוח או חקירה של סוג נתונים זה לקחת יותר זמן. לדוגמה, מדען שרוצה למצוא את הטמפרטורה הממוצעת של החודש הקודם מנתוני החיישן, אך מגלה שהחיישן הקליט "e" בחלק מהנתונים שלו כדי לציין שהוא היה מקולקל במקום מספר טיפוסי, מה שאומר שהנתונים אינם שלמים.
+
+דוגמאות לנתונים לא מאורגנים: קבצי טקסט, הודעות טקסט, קבצי וידאו.
+
+### נתונים חצי מאורגנים
+נתונים חצי מאורגנים כוללים מאפיינים שהופכים אותם לשילוב של נתונים מאורגנים ולא מאורגנים. הם בדרך כלל לא תואמים לפורמט של שורות ועמודות אך מאורגנים בצורה שנחשבת למאורגנת ועשויים לעקוב אחר פורמט קבוע או סט של כללים. המבנה ישתנה בין מקורות, כמו היררכיה מוגדרת היטב למשהו גמיש יותר שמאפשר שילוב קל של מידע חדש. מטא-נתונים הם אינדיקטורים שעוזרים להחליט איך הנתונים מאורגנים ומאוחסנים ויהיו להם שמות שונים, בהתאם לסוג הנתונים. כמה שמות נפוצים למטא-נתונים הם תגיות, אלמנטים, ישויות ותכונות. לדוגמה, הודעת דוא"ל טיפוסית תכלול נושא, גוף ומערכת נמענים וניתן לארגן אותה לפי מי שלח אותה או מתי היא נשלחה.
+
+דוגמאות לנתונים חצי מאורגנים: HTML, קבצי CSV, JavaScript Object Notation (JSON).
+
+## מקורות נתונים
+
+מקור נתונים הוא המיקום הראשוני שבו הנתונים נוצרו, או המקום שבו הם "חיים" וישתנה בהתאם לאופן ולזמן שבו הם נאספו. נתונים שנוצרו על ידי המשתמשים שלהם נקראים נתונים ראשוניים בעוד שנתונים משניים מגיעים ממקור שאסף נתונים לשימוש כללי. לדוגמה, קבוצת מדענים שאוספת תצפיות ביער גשם תיחשב לנתונים ראשוניים ואם הם יחליטו לשתף אותם עם מדענים אחרים זה ייחשב לנתונים משניים עבור אלו שמשתמשים בהם.
+
+מסדי נתונים הם מקור נפוץ ומסתמכים על מערכת ניהול מסדי נתונים לארח ולתחזק את הנתונים, כאשר משתמשים משתמשים בפקודות שנקראות שאילתות כדי לחקור את הנתונים. קבצים כמקורות נתונים יכולים להיות קבצי שמע, תמונה ווידאו וכן גיליונות אלקטרוניים כמו Excel. מקורות אינטרנט הם מיקום נפוץ לאירוח נתונים, שבו ניתן למצוא גם מסדי נתונים וגם קבצים. ממשקי תכנות יישומים, הידועים גם כ-APIs, מאפשרים למתכנתים ליצור דרכים לשתף נתונים עם משתמשים חיצוניים דרך האינטרנט, בעוד שתהליך של גרידת רשת (web scraping) שולף נתונים מדף אינטרנט. [השיעורים בעבודה עם נתונים](../../../../../../../../../2-Working-With-Data) מתמקדים באיך להשתמש במקורות נתונים שונים.
+
+## סיכום
+
+בשיעור הזה למדנו:
+
+- מה הם נתונים
+- איך נתונים מתוארים
+- איך נתונים מסווגים ומקוטלגים
+- איפה ניתן למצוא נתונים
+
+## 🚀 אתגר
+
+Kaggle הוא מקור מצוין למערכי נתונים פתוחים. השתמשו ב[כלי החיפוש של מערכי נתונים](https://www.kaggle.com/datasets) כדי למצוא כמה מערכי נתונים מעניינים וסווגו 3-5 מערכי נתונים לפי הקריטריונים הבאים:
+
+- האם הנתונים כמותיים או איכותיים?
+- האם הנתונים מאורגנים, לא מאורגנים או חצי מאורגנים?
+
+## [שאלון אחרי השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/5)
+
+## סקירה ולימוד עצמי
+
+- יחידת Microsoft Learn, בשם [סיווג הנתונים שלך](https://docs.microsoft.com/en-us/learn/modules/choose-storage-approach-in-azure/2-classify-data) כוללת פירוט מפורט של נתונים מאורגנים, חצי מאורגנים ולא מאורגנים.
+
+## משימה
+
+[סיווג מערכי נתונים](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/1-Introduction/03-defining-data/assignment.md b/translations/he/1-Introduction/03-defining-data/assignment.md
new file mode 100644
index 00000000..76f24430
--- /dev/null
+++ b/translations/he/1-Introduction/03-defining-data/assignment.md
@@ -0,0 +1,79 @@
+
+# סיווג מערכי נתונים
+
+## הוראות
+
+עקבו אחר ההנחיות במשימה זו כדי לזהות ולסווג את הנתונים לאחד מכל אחד מסוגי הנתונים הבאים:
+
+**סוגי מבנה**: מובנה, חצי-מובנה, או לא מובנה
+
+**סוגי ערך**: איכותני או כמותי
+
+**סוגי מקור**: ראשוני או משני
+
+1. חברה נרכשה וכעת יש לה חברת אם. מדעני הנתונים קיבלו גיליון אלקטרוני עם מספרי טלפון של לקוחות מחברת האם.
+
+סוג מבנה:
+
+סוג ערך:
+
+סוג מקור:
+
+---
+
+2. שעון חכם אסף נתוני דופק מהמשתמש, והנתונים הגולמיים נמצאים בפורמט JSON.
+
+סוג מבנה:
+
+סוג ערך:
+
+סוג מקור:
+
+---
+
+3. סקר במקום עבודה על מצב הרוח של העובדים שמאוחסן בקובץ CSV.
+
+סוג מבנה:
+
+סוג ערך:
+
+סוג מקור:
+
+---
+
+4. אסטרופיזיקאים ניגשים למסד נתונים של גלקסיות שנאסף על ידי גשוש חלל. הנתונים מכילים את מספר הכוכבים בכל גלקסיה.
+
+סוג מבנה:
+
+סוג ערך:
+
+סוג מקור:
+
+---
+
+5. אפליקציה לניהול פיננסי אישי משתמשת ב-APIs כדי להתחבר לחשבונות הפיננסיים של המשתמש במטרה לחשב את השווי הנקי שלו. המשתמש יכול לראות את כל העסקאות שלו בפורמט של שורות ועמודות שנראה דומה לגיליון אלקטרוני.
+
+סוג מבנה:
+
+סוג ערך:
+
+סוג מקור:
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | --- |
+זיהוי נכון של כל סוגי המבנה, הערך והמקור | זיהוי נכון של 3 סוגי מבנה, ערך ומקור | זיהוי נכון של 2 או פחות סוגי מבנה, ערך ומקור |
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/1-Introduction/04-stats-and-probability/README.md b/translations/he/1-Introduction/04-stats-and-probability/README.md
new file mode 100644
index 00000000..334fa0bf
--- /dev/null
+++ b/translations/he/1-Introduction/04-stats-and-probability/README.md
@@ -0,0 +1,276 @@
+
+# מבוא קצר לסטטיסטיקה ותורת ההסתברות
+
+| ](../../sketchnotes/04-Statistics-Probability.png)|
+|:---:|
+| סטטיסטיקה והסתברות - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+סטטיסטיקה ותורת ההסתברות הן שני תחומים מתמטיים הקשורים זה לזה באופן הדוק, והם בעלי חשיבות רבה במדעי הנתונים. ניתן לעבוד עם נתונים גם ללא ידע מעמיק במתמטיקה, אך עדיין עדיף להכיר לפחות כמה מושגים בסיסיים. כאן נציג מבוא קצר שיעזור לכם להתחיל.
+
+[](https://youtu.be/Z5Zy85g4Yjw)
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/6)
+
+## הסתברות ומשתנים אקראיים
+
+**הסתברות** היא מספר בין 0 ל-1 שמבטא עד כמה אירוע מסוים הוא סביר. היא מוגדרת כמספר התוצאות החיוביות (שמובילות לאירוע), מחולק במספר הכולל של התוצאות, בהנחה שכל התוצאות הן בעלות הסתברות שווה. לדוגמה, כאשר אנו מטילים קובייה, ההסתברות לקבל מספר זוגי היא 3/6 = 0.5.
+
+כשמדברים על אירועים, אנו משתמשים ב**משתנים אקראיים**. לדוגמה, המשתנה האקראי שמייצג את המספר שמתקבל בהטלת קובייה יקבל ערכים בין 1 ל-6. קבוצת המספרים מ-1 עד 6 נקראת **מרחב הדגימה**. ניתן לדבר על ההסתברות שמשתנה אקראי יקבל ערך מסוים, לדוגמה P(X=3)=1/6.
+
+המשתנה האקראי בדוגמה הקודמת נקרא **בדיד**, מכיוון שיש לו מרחב דגימה שניתן לספור, כלומר יש ערכים נפרדים שניתן למנות. ישנם מקרים שבהם מרחב הדגימה הוא טווח של מספרים ממשיים, או כל קבוצת המספרים הממשיים. משתנים כאלה נקראים **רציפים**. דוגמה טובה לכך היא הזמן שבו האוטובוס מגיע.
+
+## התפלגות הסתברות
+
+במקרה של משתנים אקראיים בדידים, קל לתאר את ההסתברות של כל אירוע באמצעות פונקציה P(X). עבור כל ערך *s* ממרחב הדגימה *S*, היא תיתן מספר בין 0 ל-1, כך שסכום כל הערכים של P(X=s) עבור כל האירועים יהיה 1.
+
+ההתפלגות הבדידה המוכרת ביותר היא **התפלגות אחידה**, שבה יש מרחב דגימה של N אלמנטים, עם הסתברות שווה של 1/N לכל אחד מהם.
+
+קשה יותר לתאר את התפלגות ההסתברות של משתנה רציף, עם ערכים שנלקחים מטווח מסוים [a,b], או מכל קבוצת המספרים הממשיים ℝ. קחו לדוגמה את זמן הגעת האוטובוס. למעשה, עבור כל זמן הגעה מדויק *t*, ההסתברות שהאוטובוס יגיע בדיוק בזמן הזה היא 0!
+
+> עכשיו אתם יודעים שאירועים עם הסתברות 0 מתרחשים, ולעיתים קרובות! לפחות בכל פעם שהאוטובוס מגיע!
+
+ניתן לדבר רק על ההסתברות שמשתנה ייפול בטווח ערכים מסוים, למשל P(t1≤X2). במקרה זה, התפלגות ההסתברות מתוארת באמצעות **פונקציית צפיפות הסתברות** p(x), כך ש-
+
+![P(t_1\le X1, x2, ..., xn. ניתן להגדיר את **הממוצע** (או **ממוצע חשבוני**) של הרצף באופן המסורתי כ-(x1+x2+xn)/n. ככל שנגדיל את גודל המדגם (כלומר ניקח את הגבול עם n→∞), נקבל את הממוצע (שנקרא גם **תוחלת**) של ההתפלגות. נסמן את התוחלת כ-**E**(x).
+
+> ניתן להראות שעבור כל התפלגות בדידה עם ערכים {x1, x2, ..., xN} והסתברויות מתאימות p1, p2, ..., pN, התוחלת תהיה E(X)=x1p1+x2p2+...+xNpN.
+
+כדי לזהות עד כמה הערכים מפוזרים, ניתן לחשב את השונות σ2 = ∑(xi - μ)2/n, כאשר μ הוא הממוצע של הרצף. הערך σ נקרא **סטיית תקן**, ו-σ2 נקרא **שונות**.
+
+## מוד, חציון ורבעונים
+
+לפעמים, הממוצע אינו מייצג באופן מספק את הערך "הטיפוסי" של הנתונים. לדוגמה, כאשר ישנם כמה ערכים קיצוניים שמחוץ לטווח, הם יכולים להשפיע על הממוצע. אינדיקציה טובה נוספת היא **חציון**, ערך כזה שחצי מהנתונים נמוכים ממנו, והחצי השני - גבוהים ממנו.
+
+כדי להבין את התפלגות הנתונים, כדאי לדבר על **רבעונים**:
+
+* הרבעון הראשון, או Q1, הוא ערך כזה ש-25% מהנתונים נמוכים ממנו
+* הרבעון השלישי, או Q3, הוא ערך ש-75% מהנתונים נמוכים ממנו
+
+ניתן לייצג את הקשר בין החציון והרבעונים באופן גרפי בדיאגרמה שנקראת **תיבת נתונים**:
+
+
+
+כאן אנו גם מחשבים את **טווח הרבעונים** IQR=Q3-Q1, ואת מה שנקרא **ערכים חריגים** - ערכים שנמצאים מחוץ לגבולות [Q1-1.5*IQR,Q3+1.5*IQR].
+
+עבור התפלגות סופית שמכילה מספר קטן של ערכים אפשריים, ערך "טיפוסי" טוב הוא זה שמופיע בתדירות הגבוהה ביותר, שנקרא **מוד**. הוא מיושם לעיתים קרובות על נתונים קטגוריים, כמו צבעים. לדוגמה, אם יש לנו שתי קבוצות של אנשים - כאלה שמעדיפים מאוד אדום, ואחרים שמעדיפים כחול. אם נקודד צבעים במספרים, הערך הממוצע לצבע המועדף יהיה איפשהו בספקטרום כתום-ירוק, מה שלא משקף את ההעדפה האמיתית של אף אחת מהקבוצות. עם זאת, המוד יהיה אחד הצבעים, או שניהם, אם מספר האנשים שמעדיפים אותם שווה (במקרה זה נקרא לדגימה **רב-מודית**).
+
+## נתונים מהעולם האמיתי
+
+כאשר אנו מנתחים נתונים מהחיים האמיתיים, הם לעיתים אינם משתנים אקראיים במובן זה שאיננו מבצעים ניסויים עם תוצאה לא ידועה. לדוגמה, קחו קבוצת שחקני בייסבול, ונתוני הגוף שלהם, כמו גובה, משקל וגיל. המספרים הללו אינם בדיוק אקראיים, אך עדיין ניתן ליישם את אותם מושגים מתמטיים. לדוגמה, רצף של משקלים של אנשים יכול להיחשב כרצף של ערכים שנלקחו ממשתנה אקראי מסוים. להלן רצף המשקלים של שחקני בייסבול אמיתיים מ-[ליגת הבייסבול הראשית](http://mlb.mlb.com/index.jsp), שנלקח מ-[מערך נתונים זה](http://wiki.stat.ucla.edu/socr/index.php/SOCR_Data_MLB_HeightsWeights) (לנוחיותכם, מוצגים רק 20 הערכים הראשונים):
+
+```
+[180.0, 215.0, 210.0, 210.0, 188.0, 176.0, 209.0, 200.0, 231.0, 180.0, 188.0, 180.0, 185.0, 160.0, 180.0, 185.0, 197.0, 189.0, 185.0, 219.0]
+```
+
+> **הערה**: כדי לראות דוגמה לעבודה עם מערך נתונים זה, עיינו ב-[מחברת המצורפת](notebook.ipynb). ישנם גם מספר אתגרים לאורך השיעור, ואתם יכולים להשלים אותם על ידי הוספת קוד למחברת זו. אם אינכם בטוחים כיצד לעבוד עם נתונים, אל תדאגו - נחזור לעבודה עם נתונים באמצעות Python בשלב מאוחר יותר. אם אינכם יודעים כיצד להריץ קוד ב-Jupyter Notebook, עיינו ב-[מאמר זה](https://soshnikov.com/education/how-to-execute-notebooks-from-github/).
+
+להלן תיבת נתונים שמציגה ממוצע, חציון ורבעונים עבור הנתונים שלנו:
+
+
+
+מכיוון שהנתונים שלנו מכילים מידע על **תפקידים** שונים של שחקנים, ניתן גם ליצור תיבת נתונים לפי תפקיד - זה יאפשר לנו להבין כיצד ערכי הפרמטרים משתנים בין התפקידים. הפעם נבחן גובה:
+
+
+
+דיאגרמה זו מציעה כי, בממוצע, גובהם של שחקני בסיס ראשון גבוה יותר מגובהם של שחקני בסיס שני. בהמשך השיעור נלמד כיצד ניתן לבדוק את ההשערה הזו בצורה פורמלית יותר, וכיצד להראות שהנתונים שלנו משמעותיים מבחינה סטטיסטית כדי להוכיח זאת.
+
+> כאשר עובדים עם נתונים מהעולם האמיתי, אנו מניחים שכל נקודות הנתונים הן דגימות שנלקחו מהתפלגות הסתברות מסוימת. הנחה זו מאפשרת לנו ליישם טכניקות של למידת מכונה ולבנות מודלים חיזוי יעילים.
+
+כדי לראות מהי התפלגות הנתונים שלנו, ניתן לשרטט גרף שנקרא **היסטוגרמה**. ציר ה-X יכיל מספר של טווחי משקל שונים (מה שנקרא **תאים**), וציר ה-Y האנכי יציג את מספר הפעמים שהדגימה של המשתנה האקראי הייתה בתוך טווח נתון.
+
+
+
+מההיסטוגרמה הזו ניתן לראות שכל הערכים מרוכזים סביב משקל ממוצע מסוים, וככל שמתרחקים ממשקל זה - פחות משקלים בערך זה מופיעים. כלומר, לא סביר שמשקלו של שחקן בייסבול יהיה שונה מאוד מהמשקל הממוצע. שונות המשקלים מראה את המידה שבה משקלים נוטים להיות שונים מהממוצע.
+
+> אם ניקח משקלים של אנשים אחרים, לא מהליגה, סביר שהתפלגות תהיה שונה. עם זאת, צורת ההתפלגות תהיה זהה, אך הממוצע והשונות ישתנו. לכן, אם נלמד את המודל שלנו על שחקני בייסבול, סביר שהוא ייתן תוצאות שגויות כאשר ניישם אותו על סטודנטים באוניברסיטה, מכיוון שהתפלגות הבסיס שונה.
+
+## התפלגות נורמלית
+
+התפלגות המשקלים שראינו לעיל היא מאוד טיפוסית, ומדידות רבות מהעולם האמיתי עוקבות אחר אותו סוג של התפלגות, אך עם ממוצע ושונות שונים. התפלגות זו נקראת **התפלגות נורמלית**, והיא משחקת תפקיד חשוב מאוד בסטטיסטיקה.
+
+שימוש בהתפלגות נורמלית הוא דרך נכונה לייצר משקלים אקראיים של שחקני בייסבול פוטנציאליים. ברגע שאנו יודעים את משקל הממוצע `mean` ואת סטיית התקן `std`, ניתן לייצר 1000 דגימות משקל בדרך הבאה:
+```python
+samples = np.random.normal(mean,std,1000)
+```
+
+אם נשרטט את ההיסטוגרמה של הדגימות שנוצרו, נראה תמונה דומה מאוד לזו שהוצגה לעיל. ואם נגדיל את מספר הדגימות ואת מספר התאים, נוכל לייצר תמונה של התפלגות נורמלית שקרובה יותר לאידיאל:
+
+
+
+*התפלגות נורמלית עם mean=0 ו-std.dev=1*
+
+## מרווחי ביטחון
+
+כאשר אנו מדברים על משקלם של שחקני בייסבול, אנו מניחים שישנו **משתנה אקראי W** שמייצג את התפלגות ההסתברות האידיאלית של משקלם של כל שחקני הבייסבול (מה שנקרא **אוכלוסייה**). רצף המשקלים שלנו מייצג תת-קבוצה של כל שחקני הבייסבול שאנו מכנים **מדגם**. שאלה מעניינת היא, האם ניתן לדעת את הפרמטרים של התפלגות W, כלומר את הממוצע והשונות של האוכלוסייה?
+
+התשובה הפשוטה ביותר תהיה לחשב את הממוצע והשונות של המדגם שלנו. עם זאת, ייתכן שהמדגם האקראי שלנו אינו מייצג באופן מדויק את האוכלוסייה המלאה. לכן יש היגיון לדבר על **מרווח ביטחון**.
+> **רווח סמך** הוא הערכה של הממוצע האמיתי של האוכלוסייה בהתבסס על המדגם שלנו, אשר מדויק ברמת הסתברות מסוימת (או **רמת ביטחון**).
+בהנחה שיש לנו מדגם X1, ..., Xn מההתפלגות שלנו. בכל פעם שניקח מדגם מההתפלגות, נקבל ערך ממוצע שונה μ. לכן ניתן להתייחס ל-μ כמשתנה מקרי. **אינטרוול ביטחון** עם רמת ביטחון p הוא זוג ערכים (Lp,Rp), כך ש-**P**(Lp≤μ≤Rp) = p, כלומר ההסתברות שהממוצע הנמדד ייפול בתוך האינטרוול שווה ל-p.
+
+מעבר להקדמה הקצרה שלנו, לא ניכנס לפרטים כיצד מחשבים את אינטרוולי הביטחון הללו. ניתן למצוא פרטים נוספים [בויקיפדיה](https://en.wikipedia.org/wiki/Confidence_interval). בקצרה, אנו מגדירים את ההתפלגות של ממוצע המדגם המחושב ביחס לממוצע האמיתי של האוכלוסייה, שנקראת **התפלגות סטודנט**.
+
+> **עובדה מעניינת**: התפלגות סטודנט נקראת כך על שם המתמטיקאי ויליאם סילי גוסט, שפרסם את מאמרו תחת שם העט "סטודנט". הוא עבד במבשלת גינס, ולפי אחת הגרסאות, מעסיקו לא רצה שהציבור הרחב יידע שהם משתמשים בבדיקות סטטיסטיות כדי לקבוע את איכות חומרי הגלם.
+
+אם נרצה להעריך את הממוצע μ של האוכלוסייה שלנו עם רמת ביטחון p, נצטרך לקחת את *(1-p)/2-th percentile* מהתפלגות סטודנט A, שניתן לקחת מטבלאות או לחשב באמצעות פונקציות מובנות בתוכנות סטטיסטיות (למשל Python, R וכו'). אז האינטרוול עבור μ יינתן על ידי X±A*D/√n, כאשר X הוא הממוצע שהתקבל במדגם, ו-D הוא סטיית התקן.
+
+> **הערה**: אנו גם מדלגים על דיון במושג חשוב של [דרגות חופש](https://en.wikipedia.org/wiki/Degrees_of_freedom_(statistics)), שהוא משמעותי ביחס להתפלגות סטודנט. ניתן לעיין בספרים מקיפים יותר על סטטיסטיקה כדי להבין מושג זה לעומק.
+
+דוגמה לחישוב אינטרוול ביטחון עבור משקלים וגבהים ניתנת ב-[מחברות המצורפות](notebook.ipynb).
+
+| p | ממוצע משקל |
+|-----|-----------|
+| 0.85 | 201.73±0.94 |
+| 0.90 | 201.73±1.08 |
+| 0.95 | 201.73±1.28 |
+
+שימו לב שככל שרמת הביטחון גבוהה יותר, האינטרוול הביטחון רחב יותר.
+
+## בדיקת השערות
+
+במאגר הנתונים של שחקני הבייסבול שלנו, ישנם תפקידים שונים לשחקנים, שניתן לסכם בטבלה הבאה (ראו את [המחברת המצורפת](notebook.ipynb) כדי לראות כיצד ניתן לחשב טבלה זו):
+
+| תפקיד | גובה | משקל | כמות |
+|------|--------|--------|-------|
+| תופס | 72.723684 | 204.328947 | 76 |
+| חובט ייעודי | 74.222222 | 220.888889 | 18 |
+| בסיס ראשון | 74.000000 | 213.109091 | 55 |
+| שחקן חוץ | 73.010309 | 199.113402 | 194 |
+| מגיש מחליף | 74.374603 | 203.517460 | 315 |
+| בסיס שני | 71.362069 | 184.344828 | 58 |
+| שורטסטופ | 71.903846 | 182.923077 | 52 |
+| מגיש ראשי | 74.719457 | 205.163636 | 221 |
+| בסיס שלישי | 73.044444 | 200.955556 | 45 |
+
+ניתן להבחין כי ממוצע הגבהים של שחקני בסיס ראשון גבוה מזה של שחקני בסיס שני. לכן, אנו עשויים להסיק ש-**שחקני בסיס ראשון גבוהים יותר משחקני בסיס שני**.
+
+> הצהרה זו נקראת **השערה**, משום שאיננו יודעים אם העובדה באמת נכונה או לא.
+
+עם זאת, לא תמיד ברור אם ניתן להסיק מסקנה זו. מהדיון לעיל אנו יודעים שלכל ממוצע יש אינטרוול ביטחון משויך, ולכן ייתכן שההבדל הזה הוא רק טעות סטטיסטית. אנו זקוקים לדרך פורמלית יותר לבדוק את ההשערה שלנו.
+
+בואו נחשב אינטרוולי ביטחון בנפרד עבור גבהים של שחקני בסיס ראשון ושני:
+
+| רמת ביטחון | בסיס ראשון | בסיס שני |
+|------------|---------------|----------------|
+| 0.85 | 73.62..74.38 | 71.04..71.69 |
+| 0.90 | 73.56..74.44 | 70.99..71.73 |
+| 0.95 | 73.47..74.53 | 70.92..71.81 |
+
+ניתן לראות שבשום רמת ביטחון האינטרוולים אינם חופפים. זה מוכיח את ההשערה שלנו ששחקני בסיס ראשון גבוהים יותר משחקני בסיס שני.
+
+באופן פורמלי יותר, הבעיה שאנו פותרים היא לבדוק אם **שתי התפלגויות הסתברות זהות**, או לפחות יש להן אותם פרמטרים. בהתאם להתפלגות, עלינו להשתמש בבדיקות שונות לכך. אם אנו יודעים שההתפלגויות שלנו נורמליות, נוכל ליישם **[Student t-test](https://en.wikipedia.org/wiki/Student%27s_t-test)**.
+
+בבדיקת t של סטודנט, אנו מחשבים את **ערך t**, שמצביע על ההבדל בין הממוצעים, תוך התחשבות בשונות. הוכח שערך t עוקב אחרי **התפלגות סטודנט**, מה שמאפשר לנו לקבל את ערך הסף עבור רמת ביטחון נתונה **p** (ניתן לחשב זאת או למצוא בטבלאות מספריות). לאחר מכן אנו משווים את ערך t לערך הסף כדי לאשר או לדחות את ההשערה.
+
+ב-Python, ניתן להשתמש בחבילת **SciPy**, הכוללת את הפונקציה `ttest_ind` (בנוסף להרבה פונקציות סטטיסטיות שימושיות אחרות!). היא מחשבת עבורנו את ערך t, וגם מבצעת חיפוש הפוך של ערך הביטחון p, כך שנוכל פשוט להסתכל על רמת הביטחון כדי להסיק מסקנות.
+
+לדוגמה, ההשוואה שלנו בין גבהים של שחקני בסיס ראשון ושני נותנת את התוצאות הבאות:
+```python
+from scipy.stats import ttest_ind
+
+tval, pval = ttest_ind(df.loc[df['Role']=='First_Baseman',['Height']], df.loc[df['Role']=='Designated_Hitter',['Height']],equal_var=False)
+print(f"T-value = {tval[0]:.2f}\nP-value: {pval[0]}")
+```
+```
+T-value = 7.65
+P-value: 9.137321189738925e-12
+```
+במקרה שלנו, ערך p נמוך מאוד, מה שמעיד על ראיות חזקות לכך ששחקני בסיס ראשון גבוהים יותר.
+
+ישנם גם סוגים אחרים של השערות שנרצה לבדוק, למשל:
+* להוכיח שמדגם נתון עוקב אחרי התפלגות מסוימת. במקרה שלנו הנחנו שהגבהים מתפלגים נורמלית, אך זה דורש אימות סטטיסטי פורמלי.
+* להוכיח שערך ממוצע של מדגם תואם לערך מוגדר מראש.
+* להשוות ממוצעים של מספר מדגמים (למשל, מה ההבדל ברמות האושר בין קבוצות גיל שונות).
+
+## חוק המספרים הגדולים ותורת הגבול המרכזי
+
+אחת הסיבות לכך שהתפלגות נורמלית חשובה היא **תורת הגבול המרכזי**. בהנחה שיש לנו מדגם גדול של N ערכים עצמאיים X1, ..., XN, שנדגמו מכל התפלגות עם ממוצע μ ושונות σ2. אז, עבור N גדול מספיק (במילים אחרות, כאשר N→∞), הממוצע ΣiXi יתפלג נורמלית, עם ממוצע μ ושונות σ2/N.
+
+> דרך נוספת לפרש את תורת הגבול המרכזי היא לומר שלא משנה מה ההתפלגות, כאשר מחשבים את הממוצע של סכום ערכים של משתנה מקרי כלשהו, מגיעים להתפלגות נורמלית.
+
+מתורת הגבול המרכזי גם נובע שכאשר N→∞, ההסתברות שהממוצע של המדגם יהיה שווה ל-μ הופכת ל-1. זה ידוע כ-**חוק המספרים הגדולים**.
+
+## קו-וריאציה וקורלציה
+
+אחד הדברים שמדעי הנתונים עושים הוא למצוא קשרים בין נתונים. אנו אומרים ששתי סדרות **מתואמות** כאשר הן מציגות התנהגות דומה באותו זמן, כלומר הן עולות/יורדות יחד, או שסדרה אחת עולה כאשר השנייה יורדת ולהפך. במילים אחרות, נראה שיש קשר כלשהו בין שתי הסדרות.
+
+> קורלציה לא בהכרח מצביעה על קשר סיבתי בין שתי סדרות; לפעמים שני המשתנים יכולים להיות תלויים בסיבה חיצונית כלשהי, או שזה יכול להיות במקרה ששתי הסדרות מתואמות. עם זאת, קורלציה מתמטית חזקה היא אינדיקציה טובה לכך ששני משתנים קשורים איכשהו.
+
+מתמטית, המושג המרכזי שמראה את הקשר בין שני משתנים מקריים הוא **קו-וריאציה**, שמחושבת כך: Cov(X,Y) = **E**\[(X-**E**(X))(Y-**E**(Y))\]. אנו מחשבים את הסטייה של שני המשתנים מהממוצע שלהם, ואז מכפילים את הסטיות הללו. אם שני המשתנים סוטים יחד, המכפלה תמיד תהיה ערך חיובי, שיצטבר לקו-וריאציה חיובית. אם שני המשתנים סוטים לא-ביחד (כלומר אחד יורד מתחת לממוצע כאשר השני עולה מעל הממוצע), תמיד נקבל מספרים שליליים, שיצטברו לקו-וריאציה שלילית. אם הסטיות אינן תלויות, הן יסתכמו לכמעט אפס.
+
+הערך המוחלט של קו-וריאציה לא אומר לנו הרבה על גודל הקורלציה, משום שהוא תלוי בגודל הערכים בפועל. כדי לנרמל אותו, ניתן לחלק את הקו-וריאציה בסטיית התקן של שני המשתנים, כדי לקבל **קורלציה**. הדבר הטוב הוא שהקורלציה תמיד בטווח [-1,1], כאשר 1 מציין קורלציה חיובית חזקה בין הערכים, -1 - קורלציה שלילית חזקה, ו-0 - אין קורלציה כלל (המשתנים עצמאיים).
+
+**דוגמה**: ניתן לחשב קורלציה בין משקלים וגבהים של שחקני בייסבול מהמאגר שהוזכר לעיל:
+```python
+print(np.corrcoef(weights,heights))
+```
+כתוצאה מכך, נקבל **מטריצת קורלציה** כמו זו:
+```
+array([[1. , 0.52959196],
+ [0.52959196, 1. ]])
+```
+
+> מטריצת קורלציה C יכולה להיות מחושבת עבור כל מספר של סדרות קלט S1, ..., Sn. הערך של Cij הוא הקורלציה בין Si ו-Sj, והאלמנטים האלכסוניים תמיד שווים ל-1 (שזו גם קורלציה עצמית של Si).
+
+במקרה שלנו, הערך 0.53 מציין שישנה קורלציה מסוימת בין משקל וגובה של אדם. ניתן גם ליצור תרשים פיזור של ערך אחד מול השני כדי לראות את הקשר באופן חזותי:
+
+
+
+> דוגמאות נוספות לקורלציה וקו-וריאציה ניתן למצוא ב-[מחברת המצורפת](notebook.ipynb).
+
+## סיכום
+
+בפרק זה למדנו:
+
+* תכונות סטטיסטיות בסיסיות של נתונים, כגון ממוצע, שונות, חציון ורבעונים
+* התפלגויות שונות של משתנים מקריים, כולל התפלגות נורמלית
+* כיצד למצוא קורלציה בין תכונות שונות
+* כיצד להשתמש במכשור מתמטי וסטטיסטי כדי להוכיח השערות
+* כיצד לחשב אינטרוולי ביטחון עבור משתנה מקרי בהתבסס על מדגם נתונים
+
+למרות שזו בהחלט לא רשימה ממצה של נושאים הקיימים בתחום ההסתברות והסטטיסטיקה, היא אמורה להספיק כדי לתת לכם התחלה טובה בקורס זה.
+
+## 🚀 אתגר
+
+השתמשו בקוד הדוגמה במחברת כדי לבדוק השערות אחרות:
+1. שחקני בסיס ראשון מבוגרים יותר משחקני בסיס שני
+2. שחקני בסיס ראשון גבוהים יותר משחקני בסיס שלישי
+3. שורטסטופים גבוהים יותר משחקני בסיס שני
+
+## [שאלון לאחר ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/7)
+
+## סקירה ולימוד עצמי
+
+הסתברות וסטטיסטיקה הוא נושא רחב שמגיע לו קורס משלו. אם אתם מעוניינים להעמיק בתיאוריה, ייתכן שתרצו להמשיך לקרוא כמה מהספרים הבאים:
+
+1. [קרלוס פרננדז-גרנדה](https://cims.nyu.edu/~cfgranda/) מאוניברסיטת ניו יורק כתב סיכומי הרצאות מצוינים [הסתברות וסטטיסטיקה למדעי הנתונים](https://cims.nyu.edu/~cfgranda/pages/stuff/probability_stats_for_DS.pdf) (זמין אונליין)
+1. [פיטר ואנדרו ברוס. סטטיסטיקה מעשית למדעני נתונים.](https://www.oreilly.com/library/view/practical-statistics-for/9781491952955/) [[קוד דוגמה ב-R](https://github.com/andrewgbruce/statistics-for-data-scientists)].
+1. [ג'יימס ד. מילר. סטטיסטיקה למדעי הנתונים](https://www.packtpub.com/product/statistics-for-data-science/9781788290678) [[קוד דוגמה ב-R](https://github.com/PacktPublishing/Statistics-for-Data-Science)]
+
+## משימה
+
+[מחקר קטן על סוכרת](assignment.md)
+
+## קרדיטים
+
+השיעור הזה נכתב באהבה על ידי [דמיטרי סושניקוב](http://soshnikov.com)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/1-Introduction/04-stats-and-probability/assignment.md b/translations/he/1-Introduction/04-stats-and-probability/assignment.md
new file mode 100644
index 00000000..2311818a
--- /dev/null
+++ b/translations/he/1-Introduction/04-stats-and-probability/assignment.md
@@ -0,0 +1,40 @@
+
+# מחקר קטן על סוכרת
+
+במטלה זו נעבוד עם מערך נתונים קטן של חולי סוכרת שנלקח מ-[כאן](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html).
+
+| | גיל | מין | BMI | לחץ דם | S1 | S2 | S3 | S4 | S5 | S6 | Y |
+|---|-----|-----|-----|--------|----|----|----|----|----|----|----|
+| 0 | 59 | 2 | 32.1 | 101. | 157 | 93.2 | 38.0 | 4. | 4.8598 | 87 | 151 |
+| 1 | 48 | 1 | 21.6 | 87.0 | 183 | 103.2 | 70. | 3. | 3.8918 | 69 | 75 |
+| 2 | 72 | 2 | 30.5 | 93.0 | 156 | 93.6 | 41.0 | 4.0 | 4. | 85 | 141 |
+| ... | ... | ... | ... | ...| ...| ...| ...| ...| ...| ...| ... |
+
+## הוראות
+
+* פתחו את [מחברת המטלה](assignment.ipynb) בסביבת עבודה של jupyter notebook
+* השלימו את כל המשימות המפורטות במחברת, ובפרט:
+ * [ ] חשבו ערכי ממוצע ושונות לכל הערכים
+ * [ ] צרו תרשימי קופסה (boxplots) עבור BMI, לחץ דם ו-Y בהתאם למגדר
+ * [ ] מהי התפלגות המשתנים גיל, מין, BMI ו-Y?
+ * [ ] בדקו את הקורלציה בין משתנים שונים לבין התקדמות המחלה (Y)
+ * [ ] בדקו את ההשערה שהדרגה של התקדמות הסוכרת שונה בין גברים לנשים
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | -- |
+כל המשימות הנדרשות הושלמו, הוצגו גרפית והוסברו | רוב המשימות הושלמו, חסרות הסברים או מסקנות מהגרפים ומהערכים שהתקבלו | רק משימות בסיסיות כמו חישוב ממוצע/שונות וגרפים בסיסיים הושלמו, ללא הסקת מסקנות מהנתונים
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/1-Introduction/README.md b/translations/he/1-Introduction/README.md
new file mode 100644
index 00000000..0537d41a
--- /dev/null
+++ b/translations/he/1-Introduction/README.md
@@ -0,0 +1,31 @@
+
+# מבוא למדעי הנתונים
+
+
+> צילום על ידי Stephen Dawson ב-Unsplash
+
+בשיעורים אלו תגלו כיצד מוגדרים מדעי הנתונים ותלמדו על שיקולים אתיים שעל מדען נתונים לקחת בחשבון. בנוסף, תלמדו מהי ההגדרה של נתונים ותכירו מעט את תחומי הסטטיסטיקה וההסתברות, שהם הבסיס האקדמי של מדעי הנתונים.
+
+### נושאים
+
+1. [הגדרת מדעי הנתונים](01-defining-data-science/README.md)
+2. [אתיקה במדעי הנתונים](02-ethics/README.md)
+3. [הגדרת נתונים](03-defining-data/README.md)
+4. [מבוא לסטטיסטיקה והסתברות](04-stats-and-probability/README.md)
+
+### קרדיטים
+
+השיעורים נכתבו באהבה על ידי [Nitya Narasimhan](https://twitter.com/nitya) ו-[Dmitry Soshnikov](https://twitter.com/shwars).
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/2-Working-With-Data/05-relational-databases/README.md b/translations/he/2-Working-With-Data/05-relational-databases/README.md
new file mode 100644
index 00000000..e0d2e8d0
--- /dev/null
+++ b/translations/he/2-Working-With-Data/05-relational-databases/README.md
@@ -0,0 +1,195 @@
+
+# עבודה עם נתונים: מסדי נתונים יחסיים
+
+| ](../../sketchnotes/05-RelationalData.png)|
+|:---:|
+| עבודה עם נתונים: מסדי נתונים יחסיים - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+סביר להניח שבעבר השתמשתם בגיליון אלקטרוני כדי לאחסן מידע. היו לכם שורות ועמודות, כאשר השורות הכילו את המידע (או הנתונים), והעמודות תיארו את המידע (לפעמים נקראות מטא-נתונים). מסד נתונים יחסי מבוסס על העיקרון הבסיסי הזה של עמודות ושורות בטבלאות, ומאפשר לכם לפזר מידע על פני מספר טבלאות. זה מאפשר לכם לעבוד עם נתונים מורכבים יותר, להימנע מכפילויות, ולהיות גמישים יותר באופן שבו אתם חוקרים את הנתונים. בואו נחקור את המושגים של מסד נתונים יחסי.
+
+## [שאלון לפני ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/8)
+
+## הכל מתחיל בטבלאות
+
+בלב מסד נתונים יחסי נמצאות הטבלאות. בדיוק כמו בגיליון אלקטרוני, טבלה היא אוסף של עמודות ושורות. השורה מכילה את הנתונים או המידע שאנו רוצים לעבוד איתו, כמו שם של עיר או כמות המשקעים. העמודות מתארות את הנתונים שהן מאחסנות.
+
+בואו נתחיל את החקירה שלנו ביצירת טבלה לאחסון מידע על ערים. נתחיל עם שמן והמדינה שבה הן נמצאות. ניתן לאחסן זאת בטבלה כך:
+
+| עיר | מדינה |
+| -------- | ------------- |
+| טוקיו | יפן |
+| אטלנטה | ארצות הברית |
+| אוקלנד | ניו זילנד |
+
+שימו לב ששמות העמודות **עיר**, **מדינה** ו-**אוכלוסייה** מתארים את הנתונים המאוחסנים, וכל שורה מכילה מידע על עיר אחת.
+
+## החסרונות של גישה עם טבלה אחת
+
+סביר להניח שהטבלה למעלה נראית לכם מוכרת. בואו נתחיל להוסיף נתונים נוספים למסד הנתונים המתפתח שלנו - כמות המשקעים השנתית (במילימטרים). נתמקד בשנים 2018, 2019 ו-2020. אם נוסיף זאת עבור טוקיו, זה עשוי להיראות כך:
+
+| עיר | מדינה | שנה | כמות |
+| ----- | ----- | ---- | ----- |
+| טוקיו | יפן | 2020 | 1690 |
+| טוקיו | יפן | 2019 | 1874 |
+| טוקיו | יפן | 2018 | 1445 |
+
+מה אתם שמים לב לגבי הטבלה שלנו? ייתכן שתשימו לב שאנו משכפלים את שם העיר והמדינה שוב ושוב. זה עלול לתפוס הרבה מקום אחסון, וזה בעיקר מיותר להחזיק עותקים מרובים. אחרי הכל, לטוקיו יש רק שם אחד שמעניין אותנו.
+
+בסדר, בואו ננסה משהו אחר. נוסיף עמודות חדשות לכל שנה:
+
+| עיר | מדינה | 2018 | 2019 | 2020 |
+| -------- | ------------- | ---- | ---- | ---- |
+| טוקיו | יפן | 1445 | 1874 | 1690 |
+| אטלנטה | ארצות הברית | 1779 | 1111 | 1683 |
+| אוקלנד | ניו זילנד | 1386 | 942 | 1176 |
+
+בעוד שזה נמנע מכפילויות בשורות, זה מוסיף כמה אתגרים אחרים. נצטרך לשנות את מבנה הטבלה בכל פעם שיש שנה חדשה. בנוסף, ככל שהנתונים שלנו יגדלו, השימוש בשנים כעמודות יהפוך את החישובים והשליפות למורכבים יותר.
+
+זו הסיבה שאנו זקוקים למספר טבלאות ויחסים ביניהן. על ידי פיצול הנתונים אנו יכולים להימנע מכפילויות ולהיות גמישים יותר באופן שבו אנו עובדים עם הנתונים.
+
+## מושגי היחסים
+
+בואו נחזור לנתונים שלנו ונקבע כיצד אנו רוצים לפצל אותם. אנו יודעים שאנו רוצים לאחסן את שם העיר והמדינה שלהן, כך שזה כנראה יעבוד הכי טוב בטבלה אחת.
+
+| עיר | מדינה |
+| -------- | ------------- |
+| טוקיו | יפן |
+| אטלנטה | ארצות הברית |
+| אוקלנד | ניו זילנד |
+
+אבל לפני שניצור את הטבלה הבאה, אנו צריכים להבין כיצד להתייחס לכל עיר. אנו זקוקים לצורה כלשהי של מזהה, ID או (במונחים טכניים של מסדי נתונים) מפתח ראשי. מפתח ראשי הוא ערך המשמש לזיהוי שורה מסוימת בטבלה. בעוד שזה יכול להיות מבוסס על ערך עצמו (למשל, שם העיר), כמעט תמיד עדיף שזה יהיה מספר או מזהה אחר. איננו רוצים שהמזהה ישתנה אי פעם, שכן זה ישבור את היחס. ברוב המקרים, המפתח הראשי או המזהה יהיה מספר שנוצר אוטומטית.
+
+> ✅ מפתח ראשי מקוצר לעיתים קרובות כ-PK
+
+### ערים
+
+| city_id | עיר | מדינה |
+| ------- | -------- | ------------- |
+| 1 | טוקיו | יפן |
+| 2 | אטלנטה | ארצות הברית |
+| 3 | אוקלנד | ניו זילנד |
+
+> ✅ שימו לב שאנו משתמשים במונחים "id" ו"מפתח ראשי" לסירוגין במהלך השיעור. המושגים הללו חלים גם על DataFrames, שתלמדו עליהם בהמשך. DataFrames אינם משתמשים במונח "מפתח ראשי", אך תבחינו שהם מתנהגים באופן דומה.
+
+עם יצירת טבלת הערים שלנו, בואו נאחסן את נתוני המשקעים. במקום לשכפל את המידע המלא על העיר, אנו יכולים להשתמש במזהה. עלינו גם לוודא שלטבלה החדשה שניצור יהיה עמודת *id*, שכן לכל טבלה צריך להיות מזהה או מפתח ראשי.
+
+### משקעים
+
+| rainfall_id | city_id | שנה | כמות |
+| ----------- | ------- | ---- | ----- |
+| 1 | 1 | 2018 | 1445 |
+| 2 | 1 | 2019 | 1874 |
+| 3 | 1 | 2020 | 1690 |
+| 4 | 2 | 2018 | 1779 |
+| 5 | 2 | 2019 | 1111 |
+| 6 | 2 | 2020 | 1683 |
+| 7 | 3 | 2018 | 1386 |
+| 8 | 3 | 2019 | 942 |
+| 9 | 3 | 2020 | 1176 |
+
+שימו לב לעמודת **city_id** בטבלת **משקעים** החדשה שנוצרה. עמודה זו מכילה ערכים שמפנים למזהים בטבלת **ערים**. במונחים טכניים של נתונים יחסיים, זה נקרא **מפתח זר**; זהו מפתח ראשי מטבלה אחרת. אתם יכולים לחשוב על זה כהפניה או מצביע. **city_id** 1 מפנה לטוקיו.
+
+> [!NOTE] מפתח זר מקוצר לעיתים קרובות כ-FK
+
+## שליפת הנתונים
+
+עם הנתונים שלנו מחולקים לשתי טבלאות, אתם עשויים לתהות כיצד אנו שולפים אותם. אם אנו משתמשים במסד נתונים יחסי כמו MySQL, SQL Server או Oracle, אנו יכולים להשתמש בשפה שנקראת Structured Query Language או SQL. SQL (לפעמים נהגית "סיקוול") היא שפה סטנדרטית המשמשת לשליפה ושינוי נתונים במסד נתונים יחסי.
+
+כדי לשלוף נתונים משתמשים בפקודה `SELECT`. בבסיסה, אתם **בוחרים** את העמודות שאתם רוצים לראות **מתוך** הטבלה שבה הן נמצאות. אם תרצו להציג רק את שמות הערים, תוכלו להשתמש בפקודה הבאה:
+
+```sql
+SELECT city
+FROM cities;
+
+-- Output:
+-- Tokyo
+-- Atlanta
+-- Auckland
+```
+
+`SELECT` הוא המקום שבו אתם מציינים את העמודות, ו-`FROM` הוא המקום שבו אתם מציינים את הטבלאות.
+
+> [NOTE] תחביר SQL אינו תלוי רישיות, כלומר `select` ו-`SELECT` הם אותו הדבר. עם זאת, תלוי בסוג מסד הנתונים שבו אתם משתמשים, ייתכן שהעמודות והטבלאות יהיו תלויי רישיות. כתוצאה מכך, זו פרקטיקה טובה תמיד להתייחס לכל דבר בתכנות כאילו הוא תלוי רישיות. כאשר כותבים שאילתות SQL, נהוג לכתוב את מילות המפתח באותיות גדולות.
+
+השאילתה למעלה תציג את כל הערים. בואו נדמיין שאנו רוצים להציג רק ערים בניו זילנד. אנו זקוקים לצורה כלשהי של מסנן. מילת המפתח SQL עבור זה היא `WHERE`, או "איפה שמשהו נכון".
+
+```sql
+SELECT city
+FROM cities
+WHERE country = 'New Zealand';
+
+-- Output:
+-- Auckland
+```
+
+## חיבור נתונים
+
+עד עכשיו שלפנו נתונים מטבלה אחת. כעת אנו רוצים לחבר את הנתונים משתי הטבלאות **ערים** ו-**משקעים**. זה נעשה על ידי *חיבור* שלהן יחד. למעשה תיצרו חיבור בין שתי הטבלאות, ותתאימו את הערכים מעמודה מכל טבלה.
+
+בדוגמה שלנו, נתאים את עמודת **city_id** בטבלת **משקעים** לעמודת **city_id** בטבלת **ערים**. זה יתאים את ערך המשקעים לעיר המתאימה לו. סוג החיבור שנבצע נקרא *חיבור פנימי* (inner join), כלומר אם יש שורות שלא מתאימות לשום דבר מהטבלה השנייה, הן לא יוצגו. במקרה שלנו לכל עיר יש נתוני משקעים, כך שהכל יוצג.
+
+בואו נשלוף את נתוני המשקעים לשנת 2019 עבור כל הערים שלנו.
+
+נעשה זאת בשלבים. השלב הראשון הוא לחבר את הנתונים יחד על ידי ציון העמודות לחיבור - **city_id** כפי שהודגש קודם.
+
+```sql
+SELECT cities.city
+ rainfall.amount
+FROM cities
+ INNER JOIN rainfall ON cities.city_id = rainfall.city_id
+```
+
+הדגשנו את שתי העמודות שאנו רוצים, ואת העובדה שאנו רוצים לחבר את הטבלאות יחד לפי **city_id**. כעת נוכל להוסיף את הצהרת `WHERE` כדי לסנן רק את שנת 2019.
+
+```sql
+SELECT cities.city
+ rainfall.amount
+FROM cities
+ INNER JOIN rainfall ON cities.city_id = rainfall.city_id
+WHERE rainfall.year = 2019
+
+-- Output
+
+-- city | amount
+-- -------- | ------
+-- Tokyo | 1874
+-- Atlanta | 1111
+-- Auckland | 942
+```
+
+## סיכום
+
+מסדי נתונים יחסיים מתמקדים בחלוקת מידע בין מספר טבלאות שמחוברות מחדש לצורך תצוגה וניתוח. זה מספק גמישות גבוהה לביצוע חישובים ולעבודה עם נתונים. ראיתם את המושגים הבסיסיים של מסד נתונים יחסי, וכיצד לבצע חיבור בין שתי טבלאות.
+
+## 🚀 אתגר
+
+ישנם מסדי נתונים יחסיים רבים זמינים באינטרנט. תוכלו לחקור את הנתונים באמצעות הכישורים שלמדתם כאן.
+
+## שאלון לאחר ההרצאה
+
+## [שאלון לאחר ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/9)
+
+## סקירה ולמידה עצמית
+
+ישנם מספר משאבים זמינים ב-[Microsoft Learn](https://docs.microsoft.com/learn?WT.mc_id=academic-77958-bethanycheum) להמשך חקירת SQL ומושגי מסדי נתונים יחסיים:
+
+- [תיאור מושגי נתונים יחסיים](https://docs.microsoft.com//learn/modules/describe-concepts-of-relational-data?WT.mc_id=academic-77958-bethanycheum)
+- [התחלה עם שאילתות ב-Transact-SQL](https://docs.microsoft.com//learn/paths/get-started-querying-with-transact-sql?WT.mc_id=academic-77958-bethanycheum) (Transact-SQL היא גרסה של SQL)
+- [תוכן SQL ב-Microsoft Learn](https://docs.microsoft.com/learn/browse/?products=azure-sql-database%2Csql-server&expanded=azure&WT.mc_id=academic-77958-bethanycheum)
+
+## משימה
+
+[כותרת המשימה](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לאי-הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/2-Working-With-Data/05-relational-databases/assignment.md b/translations/he/2-Working-With-Data/05-relational-databases/assignment.md
new file mode 100644
index 00000000..858c325a
--- /dev/null
+++ b/translations/he/2-Working-With-Data/05-relational-databases/assignment.md
@@ -0,0 +1,73 @@
+
+# הצגת נתוני שדות תעופה
+
+ניתן לך [מאגר נתונים](https://raw.githubusercontent.com/Microsoft/Data-Science-For-Beginners/main/2-Working-With-Data/05-relational-databases/airports.db) המבוסס על [SQLite](https://sqlite.org/index.html) שמכיל מידע על שדות תעופה. הסכימה מוצגת למטה. תשתמש/י ב-[תוסף SQLite](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) ב-[Visual Studio Code](https://code.visualstudio.com?WT.mc_id=academic-77958-bethanycheum) כדי להציג מידע על שדות תעופה בערים שונות.
+
+## הוראות
+
+כדי להתחיל במשימה, תצטרך/י לבצע כמה שלבים. תצטרך/י להתקין כמה כלים ולהוריד את מאגר הנתונים לדוגמה.
+
+### הגדרת המערכת שלך
+
+תוכל/י להשתמש ב-Visual Studio Code ובתוסף SQLite כדי לעבוד עם מאגר הנתונים.
+
+1. גש/י ל-[code.visualstudio.com](https://code.visualstudio.com?WT.mc_id=academic-77958-bethanycheum) ופעל/י לפי ההוראות להתקנת Visual Studio Code
+1. התקן/י את [תוסף SQLite](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) כפי שמוסבר בדף ה-Marketplace
+
+### הורדה ופתיחת מאגר הנתונים
+
+כעת תוריד/י ותפתח/י את מאגר הנתונים.
+
+1. הורד/י את [קובץ המאגר מ-GitHub](https://raw.githubusercontent.com/Microsoft/Data-Science-For-Beginners/main/2-Working-With-Data/05-relational-databases/airports.db) ושמור/י אותו בתיקייה
+1. פתח/י את Visual Studio Code
+1. פתח/י את מאגר הנתונים בתוסף SQLite על ידי בחירה ב-**Ctl-Shift-P** (או **Cmd-Shift-P** במק) והקלדת `SQLite: Open database`
+1. בחר/י **Choose database from file** ופתח/י את קובץ **airports.db** שהורדת קודם
+1. לאחר פתיחת מאגר הנתונים (לא תראה/י עדכון על המסך), צור/י חלון שאילתות חדש על ידי בחירה ב-**Ctl-Shift-P** (או **Cmd-Shift-P** במק) והקלדת `SQLite: New query`
+
+לאחר הפתיחה, ניתן להשתמש בחלון השאילתות החדש כדי להריץ פקודות SQL על מאגר הנתונים. ניתן להשתמש בפקודה **Ctl-Shift-Q** (או **Cmd-Shift-Q** במק) כדי להריץ שאילתות על המאגר.
+
+> [!NOTE] למידע נוסף על תוסף SQLite, ניתן לעיין ב-[תיעוד](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum)
+
+## סכימת מאגר הנתונים
+
+הסכימה של מאגר נתונים היא עיצוב המבנה והטבלאות שלו. מאגר הנתונים **airports** מכיל שתי טבלאות: `cities`, שמכילה רשימת ערים בבריטניה ואירלנד, ו-`airports`, שמכילה רשימת כל שדות התעופה. מכיוון שלחלק מהערים יש מספר שדות תעופה, נוצרו שתי טבלאות לאחסון המידע. בתרגיל זה תשתמש/י ב-Joins כדי להציג מידע על ערים שונות.
+
+| ערים |
+| ---------------- |
+| id (PK, integer) |
+| city (text) |
+| country (text) |
+
+| שדות תעופה |
+| ------------------------------ |
+| id (PK, integer) |
+| name (text) |
+| code (text) |
+| city_id (FK to id in **Cities**) |
+
+## משימה
+
+צור/י שאילתות שיחזירו את המידע הבא:
+
+1. כל שמות הערים בטבלת `Cities`
+1. כל הערים באירלנד בטבלת `Cities`
+1. כל שמות שדות התעופה עם העיר והמדינה שלהם
+1. כל שדות התעופה בלונדון, בריטניה
+
+## קריטריונים להערכה
+
+| מצטיין | מספק | דורש שיפור |
+| ------- | ----- | ---------- |
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לאי-הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/2-Working-With-Data/06-non-relational/README.md b/translations/he/2-Working-With-Data/06-non-relational/README.md
new file mode 100644
index 00000000..2a9eae28
--- /dev/null
+++ b/translations/he/2-Working-With-Data/06-non-relational/README.md
@@ -0,0 +1,158 @@
+
+# עבודה עם נתונים: נתונים לא-רלציוניים
+
+| ](../../sketchnotes/06-NoSQL.png)|
+|:---:|
+|עבודה עם נתוני NoSQL - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+## [שאלון לפני ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/10)
+
+נתונים אינם מוגבלים רק למסדי נתונים רלציוניים. שיעור זה מתמקד בנתונים לא-רלציוניים ויכסה את היסודות של גיליונות אלקטרוניים ו-NoSQL.
+
+## גיליונות אלקטרוניים
+
+גיליונות אלקטרוניים הם דרך פופולרית לאחסן ולחקור נתונים מכיוון שהם דורשים פחות עבודה כדי להתחיל. בשיעור זה תלמדו את הרכיבים הבסיסיים של גיליון אלקטרוני, כמו גם נוסחאות ופונקציות. הדוגמאות יוסברו באמצעות Microsoft Excel, אך רוב החלקים והנושאים יהיו בעלי שמות ושלבים דומים בהשוואה לתוכנות גיליונות אלקטרוניים אחרות.
+
+
+
+גיליון אלקטרוני הוא קובץ שניתן לגשת אליו במערכת הקבצים של מחשב, מכשיר או מערכת קבצים מבוססת ענן. התוכנה עצמה עשויה להיות מבוססת דפדפן או יישום שצריך להתקין על מחשב או להוריד כאפליקציה. ב-Excel קבצים אלו מוגדרים גם כ-**חוברות עבודה**, ומונח זה ישמש לאורך כל השיעור.
+
+חוברת עבודה מכילה גיליון עבודה אחד או יותר, כאשר כל גיליון עבודה מסומן באמצעות כרטיסיות. בתוך גיליון עבודה ישנם מלבנים הנקראים **תאים**, המכילים את הנתונים בפועל. תא הוא החיתוך של שורה ועמודה, כאשר העמודות מסומנות באותיות והשורות ממוספרות. חלק מהגיליונות יכילו כותרות בשורות הראשונות כדי לתאר את הנתונים בתא.
+
+עם הרכיבים הבסיסיים הללו של חוברת עבודה ב-Excel, נשתמש בדוגמה מתוך [תבניות Microsoft](https://templates.office.com/) המתמקדת במלאי כדי לעבור על חלקים נוספים של גיליון אלקטרוני.
+
+### ניהול מלאי
+
+קובץ הגיליון האלקטרוני בשם "InventoryExample" הוא גיליון מעוצב של פריטים במלאי המכיל שלושה גיליונות עבודה, כאשר הכרטיסיות מסומנות "Inventory List", "Inventory Pick List" ו-"Bin Lookup". שורה 4 בגיליון העבודה Inventory List היא הכותרת, שמתארת את הערך של כל תא בעמודת הכותרת.
+
+
+
+ישנם מקרים שבהם תא תלוי בערכים של תאים אחרים כדי ליצור את ערכו. גיליון העבודה Inventory List עוקב אחר העלות של כל פריט במלאי, אך מה אם נצטרך לדעת את הערך של כל המלאי? [**נוסחאות**](https://support.microsoft.com/en-us/office/overview-of-formulas-34519a4e-1e8d-4f4b-84d4-d642c4f63263) מבצעות פעולות על נתוני תאים ומשמשות לחישוב עלות המלאי בדוגמה זו. גיליון זה השתמש בנוסחה בעמודת Inventory Value כדי לחשב את הערך של כל פריט על ידי הכפלת הכמות תחת כותרת QTY והעלויות תחת כותרת COST. לחיצה כפולה או סימון תא תציג את הנוסחה. תבחינו שנוסחאות מתחילות בסימן שווה, ואחריו החישוב או הפעולה.
+
+
+
+ניתן להשתמש בנוסחה נוספת כדי להוסיף את כל הערכים של Inventory Value יחד כדי לקבל את הערך הכולל. ניתן לחשב זאת על ידי הוספת כל תא כדי ליצור את הסכום, אך זו יכולה להיות משימה מייגעת. ל-Excel יש [**פונקציות**](https://support.microsoft.com/en-us/office/sum-function-043e1c7d-7726-4e80-8f32-07b23e057f89), או נוסחאות מוגדרות מראש לביצוע חישובים על ערכי תאים. פונקציות דורשות ארגומנטים, שהם הערכים הנדרשים לביצוע החישובים. כאשר פונקציות דורשות יותר מארגומנט אחד, יש לרשום אותם בסדר מסוים אחרת הפונקציה לא תחשב את הערך הנכון. בדוגמה זו נעשה שימוש בפונקציה SUM, ומשתמשים בערכים של Inventory Value כארגומנט כדי להוסיף את הסכום הכולל המופיע תחת שורה 3, עמודה B (המכונה גם B3).
+
+## NoSQL
+
+NoSQL הוא מונח כללי לדרכים השונות לאחסן נתונים לא-רלציוניים וניתן לפרשו כ"לא-SQL", "לא-רלציוני" או "לא רק SQL". מערכות מסדי נתונים מסוג זה יכולות להיות מסווגות לארבעה סוגים.
+
+
+> מקור: [בלוג של מיכאל ביאלקי](https://www.michalbialecki.com/2018/03/18/azure-cosmos-db-key-value-database-cloud/)
+
+[מסדי נתונים מסוג key-value](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#keyvalue-data-stores) משייכים מפתחות ייחודיים, שהם מזהים ייחודיים, לערכים. זוגות אלו נשמרים באמצעות [טבלת hash](https://www.hackerearth.com/practice/data-structures/hash-tables/basics-of-hash-tables/tutorial/) עם פונקציית hash מתאימה.
+
+
+> מקור: [Microsoft](https://docs.microsoft.com/en-us/azure/cosmos-db/graph/graph-introduction#graph-database-by-example)
+
+[מסדי נתונים מסוג גרף](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#graph-data-stores) מתארים קשרים בנתונים ומיוצגים כאוסף של צמתים וקשתות. צומת מייצג ישות, משהו שקיים בעולם האמיתי כמו סטודנט או דוח בנק. קשתות מייצגות את הקשר בין שתי ישויות. לכל צומת וקשת יש תכונות המספקות מידע נוסף עליהם.
+
+
+
+[מסדי נתונים עמודתיים](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#columnar-data-stores) מארגנים נתונים לעמודות ושורות כמו מבנה נתונים רלציוני, אך כל עמודה מחולקת לקבוצות הנקראות משפחות עמודות, שבהן כל הנתונים תחת עמודה אחת קשורים וניתן לשלוף ולשנות אותם כיחידה אחת.
+
+### מסדי נתונים מסמכים עם Azure Cosmos DB
+
+[מסדי נתונים מסמכים](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#document-data-stores) מבוססים על הרעיון של מסד נתונים מסוג key-value ומורכבים מסדרה של שדות ואובייקטים. חלק זה יחקור מסדי נתונים מסמכים עם אמולטור Cosmos DB.
+
+מסד נתונים של Cosmos DB מתאים להגדרה של "לא רק SQL", כאשר מסד הנתונים המסמכים של Cosmos DB מסתמך על SQL כדי לשאול את הנתונים. [השיעור הקודם](../05-relational-databases/README.md) על SQL מכסה את היסודות של השפה, ונוכל ליישם כמה מהשאילתות גם כאן. נשתמש באמולטור Cosmos DB, שמאפשר לנו ליצור ולחקור מסד נתונים מסמכים באופן מקומי על מחשב. קראו עוד על האמולטור [כאן](https://docs.microsoft.com/en-us/azure/cosmos-db/local-emulator?tabs=ssl-netstd21).
+
+מסמך הוא אוסף של שדות וערכי אובייקטים, כאשר השדות מתארים מה מייצג ערך האובייקט. להלן דוגמה למסמך:
+
+```json
+{
+ "firstname": "Eva",
+ "age": 44,
+ "id": "8c74a315-aebf-4a16-bb38-2430a9896ce5",
+ "_rid": "bHwDAPQz8s0BAAAAAAAAAA==",
+ "_self": "dbs/bHwDAA==/colls/bHwDAPQz8s0=/docs/bHwDAPQz8s0BAAAAAAAAAA==/",
+ "_etag": "\"00000000-0000-0000-9f95-010a691e01d7\"",
+ "_attachments": "attachments/",
+ "_ts": 1630544034
+}
+```
+
+השדות המעניינים במסמך זה הם: `firstname`, `id`, ו-`age`. שאר השדות עם הקווים התחתונים נוצרו על ידי Cosmos DB.
+
+#### חקירת נתונים עם אמולטור Cosmos DB
+
+ניתן להוריד ולהתקין את האמולטור [ל-Windows כאן](https://aka.ms/cosmosdb-emulator). עיינו ב-[תיעוד זה](https://docs.microsoft.com/en-us/azure/cosmos-db/local-emulator?tabs=ssl-netstd21#run-on-linux-macos) לאפשרויות הפעלה עבור macOS ו-Linux.
+
+האמולטור פותח חלון דפדפן, שבו תצוגת Explorer מאפשרת לחקור מסמכים.
+
+
+
+אם אתם עוקבים, לחצו על "Start with Sample" כדי ליצור מסד נתונים לדוגמה בשם SampleDB. אם תרחיבו את SampleDB על ידי לחיצה על החץ, תמצאו מיכל בשם `Persons`. מיכל מחזיק אוסף של פריטים, שהם המסמכים שבתוך המיכל. תוכלו לחקור את ארבעת המסמכים האישיים תחת `Items`.
+
+
+
+#### שאילתת נתונים מסמכים עם אמולטור Cosmos DB
+
+ניתן גם לשאול את נתוני הדוגמה על ידי לחיצה על כפתור SQL Query החדש (הכפתור השני משמאל).
+
+`SELECT * FROM c` מחזיר את כל המסמכים במיכל. נוסיף תנאי where ונמצא את כל מי שגילו פחות מ-40.
+
+`SELECT * FROM c where c.age < 40`
+
+
+
+השאילתה מחזירה שני מסמכים, שימו לב שערך הגיל עבור כל מסמך קטן מ-40.
+
+#### JSON ומסמכים
+
+אם אתם מכירים את JavaScript Object Notation (JSON), תבחינו שהמסמכים נראים דומים ל-JSON. ישנו קובץ בשם `PersonsData.json` בתיקייה זו עם נתונים נוספים שניתן להעלות למיכל Persons באמולטור באמצעות כפתור `Upload Item`.
+
+ברוב המקרים, APIs שמחזירים נתוני JSON יכולים להיות מועברים ישירות ולהישמר במסדי נתונים מסמכים. להלן מסמך נוסף, המייצג ציוצים מחשבון הטוויטר של Microsoft שנשלפו באמצעות Twitter API ואז הוכנסו ל-Cosmos DB.
+
+```json
+{
+ "created_at": "2021-08-31T19:03:01.000Z",
+ "id": "1432780985872142341",
+ "text": "Blank slate. Like this tweet if you’ve ever painted in Microsoft Paint before. https://t.co/cFeEs8eOPK",
+ "_rid": "dhAmAIUsA4oHAAAAAAAAAA==",
+ "_self": "dbs/dhAmAA==/colls/dhAmAIUsA4o=/docs/dhAmAIUsA4oHAAAAAAAAAA==/",
+ "_etag": "\"00000000-0000-0000-9f84-a0958ad901d7\"",
+ "_attachments": "attachments/",
+ "_ts": 1630537000
+```
+
+השדות המעניינים במסמך זה הם: `created_at`, `id`, ו-`text`.
+
+## 🚀 אתגר
+
+ישנו קובץ בשם `TwitterData.json` שניתן להעלות למסד הנתונים SampleDB. מומלץ להוסיף אותו למיכל נפרד. ניתן לעשות זאת על ידי:
+
+1. לחיצה על כפתור new container בפינה הימנית העליונה
+2. בחירת מסד הנתונים הקיים (SampleDB) ויצירת מזהה מיכל
+3. הגדרת מפתח החלוקה ל-`/id`
+4. לחיצה על OK (ניתן להתעלם משאר המידע בתצוגה זו מכיוון שמדובר במערך נתונים קטן שרץ מקומית במחשב שלכם)
+5. פתיחת המיכל החדש והעלאת קובץ Twitter Data באמצעות כפתור `Upload Item`
+
+נסו להריץ כמה שאילתות SELECT כדי למצוא מסמכים שבהם מופיעה המילה Microsoft בשדה הטקסט. רמז: נסו להשתמש במילת המפתח [LIKE](https://docs.microsoft.com/en-us/azure/cosmos-db/sql/sql-query-keywords#using-like-with-the--wildcard-character).
+
+## [שאלון לאחר ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/11)
+
+## סקירה ולמידה עצמית
+
+- ישנם עיצובים ותכונות נוספים שנוספו לגיליון האלקטרוני שלא כוסו בשיעור זה. ל-Microsoft יש [ספרייה גדולה של תיעוד וסרטונים](https://support.microsoft.com/excel) על Excel אם אתם מעוניינים ללמוד עוד.
+
+- תיעוד ארכיטקטוני זה מפרט את המאפיינים של סוגי הנתונים הלא-רלציוניים השונים: [נתונים לא-רלציוניים ו-NoSQL](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data).
+
+- Cosmos DB הוא מסד נתונים מבוסס ענן שיכול גם לאחסן את סוגי ה-NoSQL השונים שהוזכרו בשיעור זה. למדו עוד על סוגים אלו במודול [Cosmos DB Microsoft Learn](https://docs.microsoft.com/en-us/learn/paths/work-with-nosql-data-in-azure-cosmos-db/).
+
+## משימה
+
+[רווחי סודה](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/2-Working-With-Data/06-non-relational/assignment.md b/translations/he/2-Working-With-Data/06-non-relational/assignment.md
new file mode 100644
index 00000000..a0f59766
--- /dev/null
+++ b/translations/he/2-Working-With-Data/06-non-relational/assignment.md
@@ -0,0 +1,33 @@
+
+# רווחי סודה
+
+## הוראות
+
+קובץ ה-[גיליון האלקטרוני של Coca Cola Co](../../../../2-Working-With-Data/06-non-relational/CocaColaCo.xlsx) חסר כמה חישובים. המשימה שלך היא:
+
+1. לחשב את הרווח הגולמי לשנים הפיסקליות '15, '16, '17 ו-'18
+ - רווח גולמי = הכנסות תפעוליות נטו - עלות המוצרים שנמכרו
+1. לחשב את הממוצע של כל הרווחים הגולמיים. נסה לעשות זאת באמצעות פונקציה.
+ - ממוצע = סכום הרווחים הגולמיים מחולק במספר השנים הפיסקליות (10)
+ - תיעוד על [פונקציית AVERAGE](https://support.microsoft.com/en-us/office/average-function-047bac88-d466-426c-a32b-8f33eb960cf6)
+1. זהו קובץ Excel, אך הוא אמור להיות ניתן לעריכה בכל פלטפורמת גיליונות אלקטרוניים
+
+[קרדיט למקור הנתונים: Yiyi Wang](https://www.kaggle.com/yiyiwang0826/cocacola-excel)
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | --- |
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/2-Working-With-Data/07-python/README.md b/translations/he/2-Working-With-Data/07-python/README.md
new file mode 100644
index 00000000..2f4266e9
--- /dev/null
+++ b/translations/he/2-Working-With-Data/07-python/README.md
@@ -0,0 +1,290 @@
+
+# עבודה עם נתונים: Python וספריית Pandas
+
+|  ](../../sketchnotes/07-WorkWithPython.png) |
+| :-------------------------------------------------------------------------------------------------------: |
+| עבודה עם Python - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+[](https://youtu.be/dZjWOGbsN4Y)
+
+בעוד שמאגרי נתונים מציעים דרכים יעילות מאוד לאחסן נתונים ולבצע שאילתות באמצעות שפות שאילתה, הדרך הגמישה ביותר לעיבוד נתונים היא כתיבת תוכנית משלך כדי לטפל בנתונים. במקרים רבים, ביצוע שאילתה במאגר נתונים יהיה דרך יעילה יותר. עם זאת, במקרים שבהם נדרש עיבוד נתונים מורכב יותר, לא ניתן לבצע זאת בקלות באמצעות SQL.
+ניתן לתכנת עיבוד נתונים בכל שפת תכנות, אך ישנן שפות מסוימות שהן ברמה גבוהה יותר בכל הנוגע לעבודה עם נתונים. מדעני נתונים בדרך כלל מעדיפים אחת מהשפות הבאות:
+
+* **[Python](https://www.python.org/)**, שפת תכנות כללית, שנחשבת לעיתים קרובות לאחת האפשרויות הטובות ביותר למתחילים בשל הפשטות שלה. ל-Python יש הרבה ספריות נוספות שיכולות לעזור לך לפתור בעיות מעשיות רבות, כמו חילוץ נתונים מארכיון ZIP או המרת תמונה לגווני אפור. בנוסף למדעי הנתונים, Python משמשת גם לעיתים קרובות לפיתוח אתרים.
+* **[R](https://www.r-project.org/)** היא כלי מסורתי שפותח עם מחשבה על עיבוד נתונים סטטיסטיים. היא מכילה גם מאגר גדול של ספריות (CRAN), מה שהופך אותה לבחירה טובה לעיבוד נתונים. עם זאת, R אינה שפת תכנות כללית, והיא משמשת לעיתים רחוקות מחוץ לתחום מדעי הנתונים.
+* **[Julia](https://julialang.org/)** היא שפה נוספת שפותחה במיוחד עבור מדעי הנתונים. היא נועדה לספק ביצועים טובים יותר מ-Python, מה שהופך אותה לכלי מצוין לניסויים מדעיים.
+
+בשיעור זה, נתמקד בשימוש ב-Python לעיבוד נתונים פשוט. נניח היכרות בסיסית עם השפה. אם ברצונך לסייר לעומק ב-Python, תוכל לעיין באחד מהמשאבים הבאים:
+
+* [למד Python בדרך מהנה עם גרפיקה של צב ופרקטלים](https://github.com/shwars/pycourse) - קורס מבוא מהיר ל-Python מבוסס GitHub
+* [עשה את הצעדים הראשונים שלך עם Python](https://docs.microsoft.com/en-us/learn/paths/python-first-steps/?WT.mc_id=academic-77958-bethanycheum) מסלול למידה ב-[Microsoft Learn](http://learn.microsoft.com/?WT.mc_id=academic-77958-bethanycheum)
+
+נתונים יכולים להגיע בצורות רבות. בשיעור זה, נתמקד בשלוש צורות של נתונים - **נתונים טבלאיים**, **טקסט** ו**תמונות**.
+
+נתמקד בכמה דוגמאות לעיבוד נתונים, במקום לתת סקירה מלאה של כל הספריות הקשורות. זה יאפשר לך להבין את הרעיון המרכזי של מה אפשרי, ולהשאיר אותך עם הבנה היכן למצוא פתרונות לבעיות שלך כשאתה זקוק להם.
+
+> **העצה הכי מועילה**. כשאתה צריך לבצע פעולה מסוימת על נתונים שאינך יודע כיצד לבצע, נסה לחפש אותה באינטרנט. [Stackoverflow](https://stackoverflow.com/) מכיל בדרך כלל הרבה דוגמאות קוד שימושיות ב-Python עבור משימות טיפוסיות רבות.
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/12)
+
+## נתונים טבלאיים ו-Dataframes
+
+כבר פגשת נתונים טבלאיים כשדיברנו על מאגרי נתונים יחסיים. כשיש לך הרבה נתונים, והם נמצאים בטבלאות רבות ומקושרות, בהחלט יש היגיון להשתמש ב-SQL לעבודה איתם. עם זאת, ישנם מקרים רבים שבהם יש לנו טבלה של נתונים, ואנו צריכים לקבל **הבנה** או **תובנות** לגבי נתונים אלו, כמו התפלגות, קשרים בין ערכים, וכו'. במדעי הנתונים, ישנם מקרים רבים שבהם אנו צריכים לבצע כמה טרנספורמציות של הנתונים המקוריים, ולאחר מכן לבצע ויזואליזציה. שני השלבים הללו יכולים להתבצע בקלות באמצעות Python.
+
+ישנן שתי ספריות שימושיות ביותר ב-Python שיכולות לעזור לך להתמודד עם נתונים טבלאיים:
+* **[Pandas](https://pandas.pydata.org/)** מאפשרת לך לטפל ב-**Dataframes**, שהם אנלוגיים לטבלאות יחסיות. ניתן להגדיר עמודות עם שמות, ולבצע פעולות שונות על שורות, עמודות ו-Dataframes באופן כללי.
+* **[Numpy](https://numpy.org/)** היא ספרייה לעבודה עם **tensors**, כלומר **מערכים** רב-ממדיים. מערך מכיל ערכים מסוג בסיסי זהה, והוא פשוט יותר מ-Dataframe, אך מציע יותר פעולות מתמטיות ויוצר פחות עומס.
+
+ישנן גם כמה ספריות נוספות שכדאי להכיר:
+* **[Matplotlib](https://matplotlib.org/)** היא ספרייה המשמשת לויזואליזציה של נתונים ולשרטוט גרפים
+* **[SciPy](https://www.scipy.org/)** היא ספרייה עם כמה פונקציות מדעיות נוספות. כבר נתקלנו בספרייה זו כשדיברנו על הסתברות וסטטיסטיקה
+
+הנה קטע קוד שתשתמש בו בדרך כלל כדי לייבא את הספריות הללו בתחילת תוכנית Python:
+```python
+import numpy as np
+import pandas as pd
+import matplotlib.pyplot as plt
+from scipy import ... # you need to specify exact sub-packages that you need
+```
+
+Pandas מתמקדת בכמה מושגים בסיסיים.
+
+### Series
+
+**Series** היא רצף של ערכים, בדומה לרשימה או מערך numpy. ההבדל העיקרי הוא ש-Series מכילה גם **אינדקס**, וכשאנחנו מבצעים פעולות על Series (למשל, חיבור), האינדקס נלקח בחשבון. האינדקס יכול להיות פשוט כמו מספר שורה שלם (זהו האינדקס המשמש כברירת מחדל בעת יצירת Series מרשימה או מערך), או שהוא יכול להיות בעל מבנה מורכב, כמו טווח תאריכים.
+
+> **הערה**: יש קוד מבוא ל-Pandas במחברת המצורפת [`notebook.ipynb`](notebook.ipynb). אנו מציינים כאן רק כמה דוגמאות, ואתם בהחלט מוזמנים לבדוק את המחברת המלאה.
+
+לדוגמה: נניח שאנחנו רוצים לנתח מכירות של חנות גלידה שלנו. בואו ניצור סדרה של מספרי מכירות (מספר פריטים שנמכרו בכל יום) עבור תקופת זמן מסוימת:
+
+```python
+start_date = "Jan 1, 2020"
+end_date = "Mar 31, 2020"
+idx = pd.date_range(start_date,end_date)
+print(f"Length of index is {len(idx)}")
+items_sold = pd.Series(np.random.randint(25,50,size=len(idx)),index=idx)
+items_sold.plot()
+```
+
+
+עכשיו נניח שבכל שבוע אנחנו מארגנים מסיבה לחברים, ולוקחים 10 חבילות גלידה נוספות למסיבה. נוכל ליצור סדרה נוספת, עם אינדקס לפי שבוע, כדי להדגים זאת:
+```python
+additional_items = pd.Series(10,index=pd.date_range(start_date,end_date,freq="W"))
+```
+כשאנחנו מחברים שתי סדרות יחד, אנחנו מקבלים את המספר הכולל:
+```python
+total_items = items_sold.add(additional_items,fill_value=0)
+total_items.plot()
+```
+
+
+> **הערה** שאנחנו לא משתמשים בתחביר הפשוט `total_items+additional_items`. אם היינו עושים זאת, היינו מקבלים הרבה ערכי `NaN` (*Not a Number*) בסדרה המתקבלת. זאת מכיוון שיש ערכים חסרים עבור חלק מנקודות האינדקס בסדרה `additional_items`, וחיבור `NaN` לכל דבר מביא ל-`NaN`. לכן עלינו לציין את הפרמטר `fill_value` במהלך החיבור.
+
+עם סדרות זמן, אנחנו יכולים גם **לדגום מחדש** את הסדרה עם מרווחי זמן שונים. לדוגמה, נניח שאנחנו רוצים לחשב את ממוצע נפח המכירות חודשי. נוכל להשתמש בקוד הבא:
+```python
+monthly = total_items.resample("1M").mean()
+ax = monthly.plot(kind='bar')
+```
+
+
+### DataFrame
+
+DataFrame הוא למעשה אוסף של סדרות עם אותו אינדקס. אנחנו יכולים לשלב כמה סדרות יחד ל-DataFrame:
+```python
+a = pd.Series(range(1,10))
+b = pd.Series(["I","like","to","play","games","and","will","not","change"],index=range(0,9))
+df = pd.DataFrame([a,b])
+```
+זה ייצור טבלה אופקית כמו זו:
+| | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
+| --- | --- | ---- | --- | --- | ------ | --- | ------ | ---- | ---- |
+| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
+| 1 | I | like | to | use | Python | and | Pandas | very | much |
+
+אנחנו יכולים גם להשתמש בסדרות כעמודות, ולציין שמות עמודות באמצעות מילון:
+```python
+df = pd.DataFrame({ 'A' : a, 'B' : b })
+```
+זה ייתן לנו טבלה כמו זו:
+
+| | A | B |
+| --- | --- | ------ |
+| 0 | 1 | I |
+| 1 | 2 | like |
+| 2 | 3 | to |
+| 3 | 4 | use |
+| 4 | 5 | Python |
+| 5 | 6 | and |
+| 6 | 7 | Pandas |
+| 7 | 8 | very |
+| 8 | 9 | much |
+
+**הערה** שאנחנו יכולים גם לקבל את פריסת הטבלה הזו על ידי טרנספוזיציה של הטבלה הקודמת, למשל על ידי כתיבה
+```python
+df = pd.DataFrame([a,b]).T..rename(columns={ 0 : 'A', 1 : 'B' })
+```
+כאן `.T` מתייחס לפעולת הטרנספוזיציה של ה-DataFrame, כלומר שינוי שורות ועמודות, ופעולת `rename` מאפשרת לנו לשנות את שמות העמודות כדי להתאים לדוגמה הקודמת.
+
+הנה כמה מהפעולות החשובות ביותר שאנחנו יכולים לבצע על DataFrames:
+
+**בחירת עמודות**. אנחנו יכולים לבחור עמודות בודדות על ידי כתיבה `df['A']` - פעולה זו מחזירה סדרה. אנחנו יכולים גם לבחור תת-קבוצה של עמודות ל-DataFrame אחר על ידי כתיבה `df[['B','A']]` - זה מחזיר DataFrame נוסף.
+
+**סינון** רק שורות מסוימות לפי קריטריונים. לדוגמה, כדי להשאיר רק שורות עם עמודה `A` גדולה מ-5, אנחנו יכולים לכתוב `df[df['A']>5]`.
+
+> **הערה**: הדרך שבה סינון עובד היא כדלקמן. הביטוי `df['A']<5` מחזיר סדרה בוליאנית, שמציינת האם הביטוי הוא `True` או `False` עבור כל אלמנט בסדרה המקורית `df['A']`. כאשר סדרה בוליאנית משמשת כאינדקס, היא מחזירה תת-קבוצה של שורות ב-DataFrame. לכן לא ניתן להשתמש בביטוי בוליאני שרירותי של Python, לדוגמה, כתיבה `df[df['A']>5 and df['A']<7]` תהיה שגויה. במקום זאת, עליך להשתמש בפעולת `&` מיוחדת על סדרות בוליאניות, ולכתוב `df[(df['A']>5) & (df['A']<7)]` (*סוגריים חשובים כאן*).
+
+**יצירת עמודות מחושבות חדשות**. אנחנו יכולים ליצור בקלות עמודות מחושבות חדשות עבור ה-DataFrame שלנו באמצעות ביטוי אינטואיטיבי כמו זה:
+```python
+df['DivA'] = df['A']-df['A'].mean()
+```
+דוגמה זו מחשבת את הסטייה של A מערך הממוצע שלה. מה שקורה כאן בפועל הוא שאנחנו מחשבים סדרה, ואז משייכים את הסדרה הזו לצד השמאלי, ויוצרים עמודה חדשה. לכן, אנחנו לא יכולים להשתמש בפעולות שאינן תואמות לסדרות, לדוגמה, הקוד הבא שגוי:
+```python
+# Wrong code -> df['ADescr'] = "Low" if df['A'] < 5 else "Hi"
+df['LenB'] = len(df['B']) # <- Wrong result
+```
+הדוגמה האחרונה, למרות שהיא נכונה מבחינה תחבירית, נותנת לנו תוצאה שגויה, מכיוון שהיא משייכת את אורך הסדרה `B` לכל הערכים בעמודה, ולא את אורך האלמנטים הבודדים כפי שהתכוונו.
+
+אם אנחנו צריכים לחשב ביטויים מורכבים כמו זה, אנחנו יכולים להשתמש בפונקציה `apply`. הדוגמה האחרונה יכולה להיכתב כך:
+```python
+df['LenB'] = df['B'].apply(lambda x : len(x))
+# or
+df['LenB'] = df['B'].apply(len)
+```
+
+לאחר הפעולות לעיל, נגיע ל-DataFrame הבא:
+
+| | A | B | DivA | LenB |
+| --- | --- | ------ | ---- | ---- |
+| 0 | 1 | I | -4.0 | 1 |
+| 1 | 2 | like | -3.0 | 4 |
+| 2 | 3 | to | -2.0 | 2 |
+| 3 | 4 | use | -1.0 | 3 |
+| 4 | 5 | Python | 0.0 | 6 |
+| 5 | 6 | and | 1.0 | 3 |
+| 6 | 7 | Pandas | 2.0 | 6 |
+| 7 | 8 | very | 3.0 | 4 |
+| 8 | 9 | much | 4.0 | 4 |
+
+**בחירת שורות לפי מספרים** יכולה להתבצע באמצעות מבנה `iloc`. לדוגמה, כדי לבחור את 5 השורות הראשונות מה-DataFrame:
+```python
+df.iloc[:5]
+```
+
+**קיבוץ** משמש לעיתים קרובות כדי לקבל תוצאה דומה ל-*טבלאות ציר* ב-Excel. נניח שאנחנו רוצים לחשב את ערך הממוצע של עמודה `A` עבור כל מספר נתון של `LenB`. אז אנחנו יכולים לקבץ את ה-DataFrame שלנו לפי `LenB`, ולקרוא ל-`mean`:
+```python
+df.groupby(by='LenB').mean()
+```
+אם אנחנו צריכים לחשב ממוצע ומספר האלמנטים בקבוצה, אז אנחנו יכולים להשתמש בפונקציה `aggregate` מורכבת יותר:
+```python
+df.groupby(by='LenB') \
+ .aggregate({ 'DivA' : len, 'A' : lambda x: x.mean() }) \
+ .rename(columns={ 'DivA' : 'Count', 'A' : 'Mean'})
+```
+זה נותן לנו את הטבלה הבאה:
+
+| LenB | Count | Mean |
+| ---- | ----- | -------- |
+| 1 | 1 | 1.000000 |
+| 2 | 1 | 3.000000 |
+| 3 | 2 | 5.000000 |
+| 4 | 3 | 6.333333 |
+| 6 | 2 | 6.000000 |
+
+### קבלת נתונים
+ראינו כמה קל ליצור Series ו-DataFrames מאובייקטים של Python. עם זאת, נתונים בדרך כלל מגיעים בצורה של קובץ טקסט או טבלת Excel. למרבה המזל, Pandas מציעה לנו דרך פשוטה לטעון נתונים מהדיסק. לדוגמה, קריאת קובץ CSV היא פשוטה כמו זו:
+```python
+df = pd.read_csv('file.csv')
+```
+נראה דוגמאות נוספות לטעינת נתונים, כולל הבאתם מאתרים חיצוניים, בסעיף "אתגר".
+
+### הדפסה וגרפים
+
+מדען נתונים לעיתים קרובות צריך לחקור את הנתונים, ולכן חשוב להיות מסוגל להציג אותם בצורה חזותית. כאשר DataFrame גדול, פעמים רבות נרצה רק לוודא שאנחנו עושים הכל נכון על ידי הדפסת השורות הראשונות. ניתן לעשות זאת על ידי קריאה ל-`df.head()`. אם אתם מריצים זאת מתוך Jupyter Notebook, זה ידפיס את ה-DataFrame בצורה טבלאית יפה.
+
+כמו כן, ראינו את השימוש בפונקציה `plot` כדי להציג גרפים של עמודות מסוימות. בעוד ש-`plot` מאוד שימושית למשימות רבות ותומכת בסוגי גרפים שונים באמצעות הפרמטר `kind=`, תמיד ניתן להשתמש בספריית `matplotlib` כדי ליצור גרפים מורכבים יותר. נעסוק בהדמיית נתונים בפירוט בשיעורים נפרדים של הקורס.
+
+סקירה זו מכסה את הרעיונות החשובים ביותר של Pandas, אך הספרייה עשירה מאוד ואין גבול למה שניתן לעשות איתה! עכשיו ניישם את הידע הזה לפתרון בעיה ספציפית.
+
+## 🚀 אתגר 1: ניתוח התפשטות COVID
+
+הבעיה הראשונה שבה נתמקד היא מודלינג של התפשטות מגפת COVID-19. כדי לעשות זאת, נשתמש בנתונים על מספר הנדבקים במדינות שונות, המסופקים על ידי [Center for Systems Science and Engineering](https://systems.jhu.edu/) (CSSE) ב-[אוניברסיטת ג'ונס הופקינס](https://jhu.edu/). מערך הנתונים זמין ב-[מאגר GitHub זה](https://github.com/CSSEGISandData/COVID-19).
+
+מכיוון שאנחנו רוצים להדגים כיצד להתמודד עם נתונים, אנו מזמינים אתכם לפתוח את [`notebook-covidspread.ipynb`](notebook-covidspread.ipynb) ולקרוא אותו מההתחלה ועד הסוף. תוכלו גם להריץ תאים ולעשות כמה אתגרים שהשארנו לכם בסוף.
+
+
+
+> אם אינכם יודעים כיצד להריץ קוד ב-Jupyter Notebook, עיינו ב-[מאמר זה](https://soshnikov.com/education/how-to-execute-notebooks-from-github/).
+
+## עבודה עם נתונים לא מובנים
+
+בעוד שנתונים מגיעים לעיתים קרובות בצורה טבלאית, במקרים מסוימים אנו צריכים להתמודד עם נתונים פחות מובנים, לדוגמה, טקסט או תמונות. במקרה כזה, כדי ליישם טכניקות עיבוד נתונים שראינו קודם, עלינו **לחלץ** נתונים מובנים. הנה כמה דוגמאות:
+
+* חילוץ מילות מפתח מטקסט ובדיקת תדירות הופעתן
+* שימוש ברשתות נוירונים לחילוץ מידע על אובייקטים בתמונה
+* קבלת מידע על רגשות של אנשים מזרם מצלמת וידאו
+
+## 🚀 אתגר 2: ניתוח מאמרים על COVID
+
+באתגר זה, נמשיך עם נושא מגפת COVID, ונעסוק בעיבוד מאמרים מדעיים בנושא. ישנו [מערך נתונים CORD-19](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge) עם יותר מ-7000 (בזמן כתיבת שורות אלו) מאמרים על COVID, הזמינים עם מטא-נתונים ותקצירים (ובכחצי מהם גם טקסט מלא).
+
+דוגמה מלאה לניתוח מערך נתונים זה באמצעות [Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health/?WT.mc_id=academic-77958-bethanycheum) מתוארת [בפוסט בבלוג זה](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/). נדון בגרסה פשוטה יותר של ניתוח זה.
+
+> **NOTE**: איננו מספקים עותק של מערך הנתונים כחלק ממאגר זה. ייתכן שתצטרכו להוריד תחילה את הקובץ [`metadata.csv`](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge?select=metadata.csv) ממערך נתונים זה ב-Kaggle. ייתכן שתידרש הרשמה ל-Kaggle. תוכלו גם להוריד את מערך הנתונים ללא הרשמה [מכאן](https://ai2-semanticscholar-cord-19.s3-us-west-2.amazonaws.com/historical_releases.html), אך הוא יכלול את כל הטקסטים המלאים בנוסף לקובץ המטא-נתונים.
+
+פתחו את [`notebook-papers.ipynb`](notebook-papers.ipynb) וקראו אותו מההתחלה ועד הסוף. תוכלו גם להריץ תאים ולעשות כמה אתגרים שהשארנו לכם בסוף.
+
+
+
+## עיבוד נתוני תמונה
+
+לאחרונה פותחו מודלים AI חזקים מאוד שמאפשרים לנו להבין תמונות. ישנם משימות רבות שניתן לפתור באמצעות רשתות נוירונים מוכנות מראש או שירותי ענן. כמה דוגמאות כוללות:
+
+* **סיווג תמונות**, שיכול לעזור לכם לקטלג את התמונה לאחת מהקטגוריות המוגדרות מראש. תוכלו בקלות לאמן מסווגי תמונות משלכם באמצעות שירותים כמו [Custom Vision](https://azure.microsoft.com/services/cognitive-services/custom-vision-service/?WT.mc_id=academic-77958-bethanycheum)
+* **זיהוי אובייקטים** כדי לזהות אובייקטים שונים בתמונה. שירותים כמו [computer vision](https://azure.microsoft.com/services/cognitive-services/computer-vision/?WT.mc_id=academic-77958-bethanycheum) יכולים לזהות מספר אובייקטים נפוצים, ותוכלו לאמן מודל [Custom Vision](https://azure.microsoft.com/services/cognitive-services/custom-vision-service/?WT.mc_id=academic-77958-bethanycheum) לזהות אובייקטים ספציפיים שמעניינים אתכם.
+* **זיהוי פנים**, כולל גיל, מגדר וזיהוי רגשות. ניתן לעשות זאת באמצעות [Face API](https://azure.microsoft.com/services/cognitive-services/face/?WT.mc_id=academic-77958-bethanycheum).
+
+כל שירותי הענן הללו יכולים להיקרא באמצעות [Python SDKs](https://docs.microsoft.com/samples/azure-samples/cognitive-services-python-sdk-samples/cognitive-services-python-sdk-samples/?WT.mc_id=academic-77958-bethanycheum), ולכן ניתן לשלבם בקלות בתהליך חקר הנתונים שלכם.
+
+הנה כמה דוגמאות לחקר נתונים ממקורות תמונה:
+* בפוסט בבלוג [איך ללמוד מדעי נתונים ללא קוד](https://soshnikov.com/azure/how-to-learn-data-science-without-coding/) אנו חוקרים תמונות מאינסטגרם, בניסיון להבין מה גורם לאנשים לתת יותר לייקים לתמונה. תחילה אנו מחלצים כמה שיותר מידע מהתמונות באמצעות [computer vision](https://azure.microsoft.com/services/cognitive-services/computer-vision/?WT.mc_id=academic-77958-bethanycheum), ולאחר מכן משתמשים ב-[Azure Machine Learning AutoML](https://docs.microsoft.com/azure/machine-learning/concept-automated-ml/?WT.mc_id=academic-77958-bethanycheum) כדי לבנות מודל שניתן לפרש.
+* ב-[סדנת מחקרי פנים](https://github.com/CloudAdvocacy/FaceStudies) אנו משתמשים ב-[Face API](https://azure.microsoft.com/services/cognitive-services/face/?WT.mc_id=academic-77958-bethanycheum) כדי לחלץ רגשות של אנשים בתמונות מאירועים, בניסיון להבין מה גורם לאנשים להיות שמחים.
+
+## סיכום
+
+בין אם כבר יש לכם נתונים מובנים או לא מובנים, באמצעות Python תוכלו לבצע את כל השלבים הקשורים לעיבוד והבנת נתונים. זו כנראה הדרך הגמישה ביותר לעיבוד נתונים, ולכן רוב מדעני הנתונים משתמשים ב-Python ככלי העיקרי שלהם. לימוד Python לעומק הוא כנראה רעיון טוב אם אתם רציניים לגבי המסע שלכם במדעי הנתונים!
+
+## [שאלון לאחר השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/13)
+
+## סקירה ולימוד עצמי
+
+**ספרים**
+* [Wes McKinney. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython](https://www.amazon.com/gp/product/1491957662)
+
+**משאבים מקוונים**
+* מדריך רשמי [10 דקות ל-Pandas](https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html)
+* [תיעוד על הדמיה ב-Pandas](https://pandas.pydata.org/pandas-docs/stable/user_guide/visualization.html)
+
+**לימוד Python**
+* [למדו Python בצורה מהנה עם גרפיקת Turtle ופרקטלים](https://github.com/shwars/pycourse)
+* [עשו את הצעדים הראשונים שלכם עם Python](https://docs.microsoft.com/learn/paths/python-first-steps/?WT.mc_id=academic-77958-bethanycheum) מסלול לימוד ב-[Microsoft Learn](http://learn.microsoft.com/?WT.mc_id=academic-77958-bethanycheum)
+
+## משימה
+
+[בצעו מחקר נתונים מפורט יותר עבור האתגרים לעיל](assignment.md)
+
+## קרדיטים
+
+שיעור זה נכתב באהבה על ידי [Dmitry Soshnikov](http://soshnikov.com)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/2-Working-With-Data/07-python/assignment.md b/translations/he/2-Working-With-Data/07-python/assignment.md
new file mode 100644
index 00000000..24afb34e
--- /dev/null
+++ b/translations/he/2-Working-With-Data/07-python/assignment.md
@@ -0,0 +1,37 @@
+
+# משימה לעיבוד נתונים בפייתון
+
+במשימה זו, נבקש מכם להרחיב את הקוד שהתחלנו לפתח באתגרים שלנו. המשימה מורכבת משני חלקים:
+
+## מודלינג של התפשטות COVID-19
+
+ - [ ] שרטטו גרפים של *R* עבור 5-6 מדינות שונות על גרף אחד לצורך השוואה, או באמצעות מספר גרפים זה לצד זה.
+ - [ ] בדקו כיצד מספר מקרי המוות וההחלמות מתואמים עם מספר המקרים המאובחנים.
+ - [ ] גלו כמה זמן מחלה טיפוסית נמשכת על ידי התאמה חזותית בין שיעור ההדבקה ושיעור המוות וחיפוש אחר חריגות. ייתכן שתצטרכו לבחון מדינות שונות כדי לגלות זאת.
+ - [ ] חשבו את שיעור התמותה וכיצד הוא משתנה לאורך זמן. *ייתכן שתרצו לקחת בחשבון את משך המחלה בימים כדי להזיז סדרת זמן אחת לפני ביצוע החישובים.*
+
+## ניתוח מאמרים על COVID-19
+
+- [ ] בנו מטריצת הופעה משותפת של תרופות שונות, ובדקו אילו תרופות מופיעות לעיתים קרובות יחד (כלומר, מוזכרות באותו תקציר). ניתן לשנות את הקוד לבניית מטריצת הופעה משותפת עבור תרופות ואבחנות.
+- [ ] הציגו את המטריצה הזו באמצעות heatmap.
+- [ ] כיעד מאתגר, הציגו את ההופעה המשותפת של תרופות באמצעות [דיאגרמת מיתר](https://en.wikipedia.org/wiki/Chord_diagram). [הספרייה הזו](https://pypi.org/project/chord/) עשויה לעזור לכם לצייר דיאגרמת מיתר.
+- [ ] כיעד מאתגר נוסף, שלפו מינונים של תרופות שונות (כגון **400mg** במשפט *take 400mg of chloroquine daily*) באמצעות ביטויים רגולריים, ובנו DataFrame שמציג מינונים שונים עבור תרופות שונות. **שימו לב**: קחו בחשבון ערכים מספריים שנמצאים בסמיכות טקסטואלית לשם התרופה.
+
+## קריטריונים להערכה
+
+מצוין | מספק | דורש שיפור
+--- | --- | -- |
+כל המשימות הושלמו, הוצגו גרפית והוסברו, כולל לפחות אחד משני היעדים המאתגרים | יותר מ-5 משימות הושלמו, לא נעשה ניסיון ליעדים מאתגרים, או שהתוצאות אינן ברורות | פחות מ-5 (אך יותר מ-3) משימות הושלמו, והוויזואליזציות אינן מסייעות להדגמת הנקודה
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לאי-הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/2-Working-With-Data/08-data-preparation/README.md b/translations/he/2-Working-With-Data/08-data-preparation/README.md
new file mode 100644
index 00000000..5ba52312
--- /dev/null
+++ b/translations/he/2-Working-With-Data/08-data-preparation/README.md
@@ -0,0 +1,346 @@
+
+# עבודה עם נתונים: הכנת נתונים
+
+| ](../../sketchnotes/08-DataPreparation.png)|
+|:---:|
+|הכנת נתונים - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/14)
+
+בהתאם למקורו, נתונים גולמיים עשויים להכיל אי-סדירויות שיגרמו לאתגרים בניתוח ובמודלים. במילים אחרות, נתונים אלו יכולים להיות מסווגים כ"מלוכלכים" ויהיה צורך לנקותם. שיעור זה מתמקד בטכניקות לניקוי והמרת נתונים כדי להתמודד עם אתגרים של נתונים חסרים, לא מדויקים או לא שלמים. הנושאים הנלמדים בשיעור זה יעשו שימוש ב-Python ובספריית Pandas ויודגמו [במחברת](notebook.ipynb) בתוך ספרייה זו.
+
+## החשיבות של ניקוי נתונים
+
+- **קלות שימוש ושימוש חוזר**: כאשר נתונים מאורגנים ומנורמלים כראוי, קל יותר לחפש, להשתמש ולשתף אותם עם אחרים.
+
+- **עקביות**: מדע הנתונים לעיתים קרובות דורש עבודה עם יותר ממערך נתונים אחד, כאשר מערכי נתונים ממקורות שונים צריכים להיות משולבים יחד. הבטחת סטנדרטיזציה משותפת לכל מערך נתונים תבטיח שהנתונים יהיו עדיין שימושיים כאשר הם משולבים למערך נתונים אחד.
+
+- **דיוק המודל**: נתונים שנוקו משפרים את דיוק המודלים שמסתמכים עליהם.
+
+## מטרות וטקטיקות נפוצות לניקוי נתונים
+
+- **חקר מערך נתונים**: חקר נתונים, שמכוסה [בשיעור מאוחר יותר](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/4-Data-Science-Lifecycle/15-analyzing), יכול לעזור לך לזהות נתונים שזקוקים לניקוי. התבוננות חזותית בערכים בתוך מערך נתונים יכולה להגדיר ציפיות לגבי איך שאר הנתונים ייראו, או לספק רעיון לבעיות שניתן לפתור. חקר יכול לכלול שאילתות בסיסיות, ויזואליזציות ודגימות.
+
+- **עיצוב**: בהתאם למקור, נתונים יכולים להכיל אי-סדירויות באופן שבו הם מוצגים. זה יכול לגרום לבעיות בחיפוש ובייצוג הערך, כאשר הוא נראה בתוך מערך הנתונים אך אינו מיוצג כראוי בוויזואליזציות או בתוצאות שאילתות. בעיות עיצוב נפוצות כוללות פתרון רווחים, תאריכים וסוגי נתונים. פתרון בעיות עיצוב הוא בדרך כלל באחריות האנשים שמשתמשים בנתונים. לדוגמה, סטנדרטים לגבי איך תאריכים ומספרים מוצגים יכולים להשתנות בין מדינות.
+
+- **כפילויות**: נתונים שמופיעים יותר מפעם אחת יכולים להפיק תוצאות לא מדויקות ובדרך כלל יש להסירם. זה יכול להיות נפוץ כאשר משלבים שניים או יותר מערכי נתונים יחד. עם זאת, ישנם מקרים שבהם כפילויות במערכי נתונים משולבים מכילות חלקים שיכולים לספק מידע נוסף וייתכן שיהיה צורך לשמרם.
+
+- **נתונים חסרים**: נתונים חסרים יכולים לגרום לאי-דיוקים כמו גם לתוצאות חלשות או מוטות. לפעמים ניתן לפתור זאת על ידי "טעינה מחדש" של הנתונים, מילוי הערכים החסרים באמצעות חישוב וקוד כמו Python, או פשוט הסרת הערך והנתונים המתאימים. ישנן סיבות רבות לכך שנתונים עשויים להיות חסרים והפעולות שננקטות כדי לפתור ערכים חסרים אלו יכולות להיות תלויות באיך ולמה הם נעלמו מלכתחילה.
+
+## חקר מידע על DataFrame
+> **מטרת הלמידה:** בסיום תת-הסעיף הזה, תרגישו בנוח למצוא מידע כללי על הנתונים המאוחסנים ב-DataFrames של pandas.
+
+לאחר טעינת הנתונים ל-pandas, סביר להניח שהם יהיו ב-DataFrame (עיינו [בשיעור הקודם](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/07-python#dataframe) לסקירה מפורטת). עם זאת, אם מערך הנתונים ב-DataFrame שלכם מכיל 60,000 שורות ו-400 עמודות, איך בכלל מתחילים להבין עם מה אתם עובדים? למרבה המזל, [pandas](https://pandas.pydata.org/) מספקת כלים נוחים להצצה מהירה על מידע כללי על DataFrame בנוסף לשורות הראשונות והאחרונות.
+
+כדי לחקור את הפונקציונליות הזו, נייבא את ספריית scikit-learn של Python ונשתמש במערך נתונים איקוני: **מערך הנתונים של Iris**.
+
+```python
+import pandas as pd
+from sklearn.datasets import load_iris
+
+iris = load_iris()
+iris_df = pd.DataFrame(data=iris['data'], columns=iris['feature_names'])
+```
+| |אורך גביע (ס"מ)|רוחב גביע (ס"מ)|אורך עלי כותרת (ס"מ)|רוחב עלי כותרת (ס"מ)|
+|----------------------------------------|-----------------|----------------|---------------------|---------------------|
+|0 |5.1 |3.5 |1.4 |0.2 |
+|1 |4.9 |3.0 |1.4 |0.2 |
+|2 |4.7 |3.2 |1.3 |0.2 |
+|3 |4.6 |3.1 |1.5 |0.2 |
+|4 |5.0 |3.6 |1.4 |0.2 |
+
+- **DataFrame.info**: כדי להתחיל, משתמשים בשיטת `info()` כדי להדפיס סיכום של התוכן הקיים ב-`DataFrame`. בואו נסתכל על מערך הנתונים הזה כדי לראות מה יש לנו:
+```python
+iris_df.info()
+```
+```
+RangeIndex: 150 entries, 0 to 149
+Data columns (total 4 columns):
+ # Column Non-Null Count Dtype
+--- ------ -------------- -----
+ 0 sepal length (cm) 150 non-null float64
+ 1 sepal width (cm) 150 non-null float64
+ 2 petal length (cm) 150 non-null float64
+ 3 petal width (cm) 150 non-null float64
+dtypes: float64(4)
+memory usage: 4.8 KB
+```
+מכך, אנו יודעים שמערך הנתונים *Iris* מכיל 150 רשומות בארבע עמודות ללא ערכים ריקים. כל הנתונים מאוחסנים כמספרים בנקודה צפה של 64 ביט.
+
+- **DataFrame.head()**: לאחר מכן, כדי לבדוק את התוכן בפועל של ה-`DataFrame`, אנו משתמשים בשיטת `head()`. בואו נראה איך נראות השורות הראשונות של `iris_df` שלנו:
+```python
+iris_df.head()
+```
+```
+ sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
+0 5.1 3.5 1.4 0.2
+1 4.9 3.0 1.4 0.2
+2 4.7 3.2 1.3 0.2
+3 4.6 3.1 1.5 0.2
+4 5.0 3.6 1.4 0.2
+```
+- **DataFrame.tail()**: לעומת זאת, כדי לבדוק את השורות האחרונות של ה-`DataFrame`, אנו משתמשים בשיטת `tail()`:
+```python
+iris_df.tail()
+```
+```
+ sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
+145 6.7 3.0 5.2 2.3
+146 6.3 2.5 5.0 1.9
+147 6.5 3.0 5.2 2.0
+148 6.2 3.4 5.4 2.3
+149 5.9 3.0 5.1 1.8
+```
+> **מסקנה:** אפילו רק על ידי התבוננות במטא-נתונים על המידע ב-DataFrame או בערכים הראשונים והאחרונים שבו, ניתן לקבל מושג מיידי על הגודל, הצורה והתוכן של הנתונים שאתם מתמודדים איתם.
+
+## התמודדות עם נתונים חסרים
+> **מטרת הלמידה:** בסיום תת-הסעיף הזה, תדעו כיצד להחליף או להסיר ערכים ריקים מ-DataFrames.
+
+ברוב המקרים מערכי הנתונים שתרצו להשתמש בהם (או שתצטרכו להשתמש בהם) מכילים ערכים חסרים. האופן שבו מתמודדים עם נתונים חסרים נושא עמו פשרות עדינות שיכולות להשפיע על הניתוח הסופי ועל תוצאות בעולם האמיתי.
+
+Pandas מתמודדת עם ערכים חסרים בשתי דרכים. הראשונה שראיתם קודם לכן בסעיפים קודמים: `NaN`, או Not a Number. זהו למעשה ערך מיוחד שהוא חלק ממפרט הנקודה הצפה של IEEE והוא משמש רק לציון ערכים חסרים בנקודה צפה.
+
+עבור ערכים חסרים שאינם נקודות צפה, pandas משתמשת באובייקט `None` של Python. למרות שזה עשוי להיראות מבלבל שתיתקלו בשני סוגים שונים של ערכים שאומרים למעשה את אותו הדבר, יש לכך סיבות תכנותיות טובות ובפועל, גישה זו מאפשרת ל-pandas לספק פשרה טובה עבור רוב המקרים. עם זאת, גם ל-`None` וגם ל-`NaN` יש מגבלות שצריך להיות מודעים אליהן לגבי האופן שבו ניתן להשתמש בהם.
+
+למידע נוסף על `NaN` ו-`None`, עיינו ב-[מחברת](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb)!
+
+- **זיהוי ערכים ריקים**: ב-`pandas`, השיטות `isnull()` ו-`notnull()` הן השיטות העיקריות שלכם לזיהוי נתונים ריקים. שתיהן מחזירות מסכות בוליאניות על הנתונים שלכם. נשתמש ב-`numpy` עבור ערכי `NaN`:
+```python
+import numpy as np
+
+example1 = pd.Series([0, np.nan, '', None])
+example1.isnull()
+```
+```
+0 False
+1 True
+2 False
+3 True
+dtype: bool
+```
+התבוננו היטב בתוצאה. האם משהו מפתיע אתכם? בעוד ש-`0` הוא ערך אריתמטי ריק, הוא עדיין מספר שלם תקין ו-pandas מתייחסת אליו ככזה. `''` הוא קצת יותר עדין. למרות שהשתמשנו בו בסעיף 1 כדי לייצג ערך מחרוזת ריק, הוא עדיין אובייקט מחרוזת ולא ייצוג של ריק מבחינת pandas.
+
+עכשיו, בואו נהפוך את זה ונשתמש בשיטות אלו בצורה דומה לאופן שבו תשתמשו בהן בפועל. ניתן להשתמש במסכות בוליאניות ישירות כ-``Series`` או ``DataFrame`` אינדקס, מה שיכול להיות שימושי כאשר מנסים לעבוד עם ערכים ריקים (או קיימים) מבודדים.
+
+> **מסקנה**: הן השיטות `isnull()` והן `notnull()` מפיקות תוצאות דומות כאשר משתמשים בהן ב-`DataFrame`s: הן מציגות את התוצאות ואת האינדקס של אותן תוצאות, מה שיעזור לכם מאוד כשאתם מתמודדים עם הנתונים שלכם.
+
+- **הסרת ערכים ריקים**: מעבר לזיהוי ערכים חסרים, pandas מספקת דרך נוחה להסיר ערכים ריקים מ-`Series` ו-`DataFrame`s. (במיוחד במערכי נתונים גדולים, לעיתים קרובות מומלץ יותר פשוט להסיר ערכים חסרים [NA] מהניתוח שלכם מאשר להתמודד איתם בדרכים אחרות.) כדי לראות זאת בפעולה, נחזור ל-`example1`:
+```python
+example1 = example1.dropna()
+example1
+```
+```
+0 0
+2
+dtype: object
+```
+שימו לב שזה אמור להיראות כמו התוצאה שלכם מ-`example3[example3.notnull()]`. ההבדל כאן הוא שבמקום רק לאנדקס על הערכים הממוסכים, `dropna` הסירה את הערכים החסרים מ-`Series` `example1`.
+
+מכיוון של-`DataFrame`s יש שתי ממדים, הם מציעים יותר אפשרויות להסרת נתונים.
+
+```python
+example2 = pd.DataFrame([[1, np.nan, 7],
+ [2, 5, 8],
+ [np.nan, 6, 9]])
+example2
+```
+| | 0 | 1 | 2 |
+|------|---|---|---|
+|0 |1.0|NaN|7 |
+|1 |2.0|5.0|8 |
+|2 |NaN|6.0|9 |
+
+(שמתם לב ש-pandas שדרגה שתי עמודות לנקודות צפה כדי להתאים ל-`NaN`s?)
+
+לא ניתן להסיר ערך יחיד מ-`DataFrame`, ולכן יש להסיר שורות או עמודות שלמות. תלוי במה שאתם עושים, ייתכן שתרצו לעשות אחד או השני, ולכן pandas נותנת לכם אפשרויות לשניהם. מכיוון שבמדע הנתונים, עמודות בדרך כלל מייצגות משתנים ושורות מייצגות תצפיות, סביר יותר שתסירו שורות של נתונים; ההגדרה המחדלית של `dropna()` היא להסיר את כל השורות שמכילות ערכים ריקים כלשהם:
+
+```python
+example2.dropna()
+```
+```
+ 0 1 2
+1 2.0 5.0 8
+```
+אם יש צורך, ניתן להסיר ערכי NA מעמודות. השתמשו ב-`axis=1` כדי לעשות זאת:
+```python
+example2.dropna(axis='columns')
+```
+```
+ 2
+0 7
+1 8
+2 9
+```
+שימו לב שזה יכול להסיר הרבה נתונים שייתכן שתרצו לשמור, במיוחד במערכי נתונים קטנים יותר. מה אם אתם רוצים להסיר רק שורות או עמודות שמכילות כמה או אפילו את כל הערכים הריקים? ניתן להגדיר את ההגדרות הללו ב-`dropna` עם הפרמטרים `how` ו-`thresh`.
+
+במחדל, `how='any'` (אם תרצו לבדוק בעצמכם או לראות אילו פרמטרים נוספים יש לשיטה, הריצו `example4.dropna?` בתא קוד). ניתן גם להגדיר `how='all'` כדי להסיר רק שורות או עמודות שמכילות את כל הערכים הריקים. בואו נרחיב את דוגמת ה-`DataFrame` שלנו כדי לראות זאת בפעולה.
+
+```python
+example2[3] = np.nan
+example2
+```
+| |0 |1 |2 |3 |
+|------|---|---|---|---|
+|0 |1.0|NaN|7 |NaN|
+|1 |2.0|5.0|8 |NaN|
+|2 |NaN|6.0|9 |NaN|
+
+הפרמטר `thresh` נותן לכם שליטה מדויקת יותר: אתם מגדירים את מספר הערכים *שאינם ריקים* ששורה או עמודה צריכה להכיל כדי להישמר:
+```python
+example2.dropna(axis='rows', thresh=3)
+```
+```
+ 0 1 2 3
+1 2.0 5.0 8 NaN
+```
+כאן, השורה הראשונה והאחרונה הוסרו, מכיוון שהן מכילות רק שני ערכים שאינם ריקים.
+
+- **מילוי ערכים ריקים**: תלוי במערך הנתונים שלכם, לפעמים הגיוני יותר למלא ערכים ריקים בערכים תקפים מאשר להסירם. ניתן להשתמש ב-`isnull` כדי לעשות זאת במקום, אבל זה יכול להיות מייגע, במיוחד אם יש לכם הרבה ערכים למלא. מכיוון שזו משימה נפוצה כל כך במדע הנתונים, pandas מספקת `fillna`, שמחזירה עותק של ה-`Series` או ה-`DataFrame` עם הערכים החסרים מוחלפים באחד שאתם בוחרים. בואו ניצור דוגמת `Series` נוספת כדי לראות איך זה עובד בפועל.
+```python
+example3 = pd.Series([1, np.nan, 2, None, 3], index=list('abcde'))
+example3
+```
+```
+a 1.0
+b NaN
+c 2.0
+d NaN
+e 3.0
+dtype: float64
+```
+ניתן למלא את כל הערכים הריקים בערך יחיד, כמו `0`:
+```python
+example3.fillna(0)
+```
+```
+a 1.0
+b 0.0
+c 2.0
+d 0.0
+e 3.0
+dtype: float64
+```
+ניתן **למלא קדימה** ערכים ריקים, כלומר להשתמש בערך התקף האחרון כדי למלא ערך ריק:
+```python
+example3.fillna(method='ffill')
+```
+```
+a 1.0
+b 1.0
+c 2.0
+d 2.0
+e 3.0
+dtype: float64
+```
+ניתן גם **למלא אחורה** כדי להפיץ את הערך התקף הבא אחורה כדי למלא ערך ריק:
+```python
+example3.fillna(method='bfill')
+```
+```
+a 1.0
+b 2.0
+c 2.0
+d 3.0
+e 3.0
+dtype: float64
+```
+כפי שניתן לנחש, זה עובד באותו אופן עם `DataFrame`s, אבל ניתן גם להגדיר `axis` לאורך המילוי של ערכים ריקים. תוך שימוש שוב ב-`example2`:
+```python
+example2.fillna(method='ffill', axis=1)
+```
+```
+ 0 1 2 3
+0 1.0 1.0 7.0 7.0
+1 2.0 5.0 8.0 8.0
+2 NaN 6.0 9.0 9.0
+```
+שימו לב שכאשר ערך קודם אינו זמין למילוי קדימה, הערך הריק נשאר.
+> **עיקרי הדברים:** ישנן דרכים רבות להתמודד עם ערכים חסרים במערכי הנתונים שלך. האסטרטגיה הספציפית שבה תשתמש (הסרה, החלפה, או אפילו איך להחליף אותם) צריכה להיות מותאמת למאפיינים של הנתונים. ככל שתתעסק ותעבוד יותר עם מערכי נתונים, תפתח תחושת הבנה טובה יותר כיצד להתמודד עם ערכים חסרים.
+
+## הסרת נתונים כפולים
+
+> **מטרת הלמידה:** בסיום תת-הסעיף הזה, תרגיש בנוח לזהות ולהסיר ערכים כפולים מ-DataFrames.
+
+בנוסף לנתונים חסרים, לעיתים קרובות תיתקל בנתונים כפולים במערכי נתונים בעולם האמיתי. למרבה המזל, `pandas` מספקת דרך פשוטה לזהות ולהסיר רשומות כפולות.
+
+- **זיהוי כפילויות: `duplicated`**: ניתן לזהות בקלות ערכים כפולים באמצעות השיטה `duplicated` ב-pandas, שמחזירה מסכה בוליאנית המצביעה האם רשומה ב-`DataFrame` היא כפולה של רשומה קודמת. בואו ניצור דוגמת `DataFrame` נוספת כדי לראות זאת בפעולה.
+```python
+example4 = pd.DataFrame({'letters': ['A','B'] * 2 + ['B'],
+ 'numbers': [1, 2, 1, 3, 3]})
+example4
+```
+| |letters|numbers|
+|------|-------|-------|
+|0 |A |1 |
+|1 |B |2 |
+|2 |A |1 |
+|3 |B |3 |
+|4 |B |3 |
+
+```python
+example4.duplicated()
+```
+```
+0 False
+1 False
+2 True
+3 False
+4 True
+dtype: bool
+```
+- **הסרת כפילויות: `drop_duplicates`:** מחזירה פשוט עותק של הנתונים שבו כל הערכים הכפולים הם `False`:
+```python
+example4.drop_duplicates()
+```
+```
+ letters numbers
+0 A 1
+1 B 2
+3 B 3
+```
+גם `duplicated` וגם `drop_duplicates` בברירת מחדל מתייחסים לכל העמודות, אך ניתן להגדיר שהם יבדקו רק תת-קבוצה של עמודות ב-`DataFrame` שלך:
+```python
+example4.drop_duplicates(['letters'])
+```
+```
+letters numbers
+0 A 1
+1 B 2
+```
+
+> **עיקרי הדברים:** הסרת נתונים כפולים היא חלק חיוני כמעט בכל פרויקט מדעי נתונים. נתונים כפולים יכולים לשנות את תוצאות הניתוחים שלך ולספק תוצאות לא מדויקות!
+
+
+## 🚀 אתגר
+
+כל החומרים שנדונו זמינים כ-[Jupyter Notebook](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/2-Working-With-Data/08-data-preparation/notebook.ipynb). בנוסף, ישנם תרגילים לאחר כל סעיף, נסה אותם!
+
+## [מבחן לאחר ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/15)
+
+
+
+## סקירה ולימוד עצמי
+
+ישנן דרכים רבות לגלות ולגשת להכנת הנתונים שלך לניתוח ולמודלים, וניקוי הנתונים הוא שלב חשוב שהוא חוויה "מעשית". נסה את האתגרים האלה מ-Kaggle כדי לחקור טכניקות שהשיעור הזה לא כיסה.
+
+- [אתגר ניקוי נתונים: ניתוח תאריכים](https://www.kaggle.com/rtatman/data-cleaning-challenge-parsing-dates/)
+
+- [אתגר ניקוי נתונים: שינוי קנה מידה ונרמול נתונים](https://www.kaggle.com/rtatman/data-cleaning-challenge-scale-and-normalize-data)
+
+
+## משימה
+
+[הערכת נתונים מטופס](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/2-Working-With-Data/08-data-preparation/assignment.md b/translations/he/2-Working-With-Data/08-data-preparation/assignment.md
new file mode 100644
index 00000000..3f928221
--- /dev/null
+++ b/translations/he/2-Working-With-Data/08-data-preparation/assignment.md
@@ -0,0 +1,28 @@
+
+# הערכת נתונים מטופס
+
+לקוח בדק [טופס קטן](../../../../2-Working-With-Data/08-data-preparation/index.html) כדי לאסוף נתונים בסיסיים על בסיס הלקוחות שלו. הם הביאו את הממצאים שלהם אליך כדי לאמת את הנתונים שהם אספו. ניתן לפתוח את דף `index.html` בדפדפן כדי להסתכל על הטופס.
+
+סופק לך [מאגר נתונים של רשומות csv](../../../../data/form.csv) המכיל נתונים מהטופס וכן כמה ויזואליזציות בסיסיות. הלקוח ציין שחלק מהויזואליזציות נראות שגויות, אך הם אינם בטוחים כיצד לפתור זאת. ניתן לחקור זאת ב-[מחברת המשימה](assignment.ipynb).
+
+## הוראות
+
+השתמש בטכניקות שנלמדו בשיעור זה כדי להמליץ על שיפורים בטופס כך שיאסוף מידע מדויק ועקבי.
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | ---
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/2-Working-With-Data/README.md b/translations/he/2-Working-With-Data/README.md
new file mode 100644
index 00000000..5599d984
--- /dev/null
+++ b/translations/he/2-Working-With-Data/README.md
@@ -0,0 +1,31 @@
+
+# עבודה עם נתונים
+
+
+> צילום על ידי Alexander Sinn ב-Unsplash
+
+בשיעורים אלו תלמדו כמה מהדרכים שבהן ניתן לנהל, לעבד ולהשתמש בנתונים ביישומים. תלמדו על מסדי נתונים יחסיים ולא-יחסיים וכיצד ניתן לאחסן בהם נתונים. תלמדו את היסודות של עבודה עם Python לניהול נתונים, ותגלו כמה מהדרכים הרבות שבהן ניתן לעבוד עם Python לניהול וניתוח נתונים.
+
+### נושאים
+
+1. [מסדי נתונים יחסיים](05-relational-databases/README.md)
+2. [מסדי נתונים לא-יחסיים](06-non-relational/README.md)
+3. [עבודה עם Python](07-python/README.md)
+4. [הכנת נתונים](08-data-preparation/README.md)
+
+### קרדיטים
+
+השיעורים נכתבו באהבה על ידי [Christopher Harrison](https://twitter.com/geektrainer), [Dmitry Soshnikov](https://twitter.com/shwars) ו-[Jasmine Greenaway](https://twitter.com/paladique)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/09-visualization-quantities/README.md b/translations/he/3-Data-Visualization/09-visualization-quantities/README.md
new file mode 100644
index 00000000..afd81ea3
--- /dev/null
+++ b/translations/he/3-Data-Visualization/09-visualization-quantities/README.md
@@ -0,0 +1,219 @@
+
+# חזותיות של כמויות
+
+| ](../../sketchnotes/09-Visualizing-Quantities.png)|
+|:---:|
+| חזותיות של כמויות - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+בשיעור זה תחקור כיצד להשתמש באחת מהספריות הרבות הזמינות ב-Python כדי ללמוד כיצד ליצור חזותיות מעניינות סביב מושג הכמות. באמצעות מערך נתונים נקי על ציפורים במינסוטה, תוכל ללמוד עובדות מעניינות רבות על חיי הבר המקומיים.
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/16)
+
+## התבוננות במוטת כנפיים עם Matplotlib
+
+ספרייה מצוינת ליצירת גרפים ודיאגרמות פשוטות ומורכבות מסוגים שונים היא [Matplotlib](https://matplotlib.org/stable/index.html). באופן כללי, תהליך יצירת גרפים באמצעות ספריות אלו כולל זיהוי החלקים במערך הנתונים שברצונך למקד, ביצוע טרנספורמציות נחוצות על הנתונים, הקצאת ערכי ציר x ו-y, החלטה על סוג הגרף להצגה, ואז הצגת הגרף. Matplotlib מציעה מגוון רחב של חזותיות, אך בשיעור זה נתמקד באלו המתאימים ביותר להצגת כמויות: גרפי קו, גרפי פיזור וגרפי עמודות.
+
+> ✅ השתמש בגרף המתאים ביותר למבנה הנתונים ולסיפור שברצונך לספר.
+> - לניתוח מגמות לאורך זמן: קו
+> - להשוואת ערכים: עמודות, טורים, עוגה, פיזור
+> - להראות כיצד חלקים מתייחסים לשלם: עוגה
+> - להראות התפלגות נתונים: פיזור, עמודות
+> - להראות מגמות: קו, טור
+> - להראות קשרים בין ערכים: קו, פיזור, בועה
+
+אם יש לך מערך נתונים ואתה צריך לגלות כמה פריטים מסוימים כלולים בו, אחת המשימות הראשונות שלך תהיה לבדוק את הערכים שלו.
+
+✅ ישנם 'דפי עזר' מצוינים ל-Matplotlib [כאן](https://matplotlib.org/cheatsheets/cheatsheets.pdf).
+
+## יצירת גרף קו על ערכי מוטת כנפיים של ציפורים
+
+פתח את הקובץ `notebook.ipynb` בתיקיית השיעור והוסף תא.
+
+> הערה: הנתונים מאוחסנים בשורש מאגר זה בתיקיית `/data`.
+
+```python
+import pandas as pd
+import matplotlib.pyplot as plt
+birds = pd.read_csv('../../data/birds.csv')
+birds.head()
+```
+הנתונים הם שילוב של טקסט ומספרים:
+
+| | שם | שם מדעי | קטגוריה | סדר | משפחה | סוג | מצב שימור | אורך מינימלי | אורך מקסימלי | משקל גוף מינימלי | משקל גוף מקסימלי | מוטת כנפיים מינימלית | מוטת כנפיים מקסימלית |
+| ---: | :-------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | ------------: | ------------: | ----------------: | ----------------: | --------------------: | --------------------: |
+| 0 | ברווז שרוק שחור-בטן | Dendrocygna autumnalis | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
+| 1 | ברווז שרוק חום | Dendrocygna bicolor | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
+| 2 | אווז שלג | Anser caerulescens | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
+| 3 | אווז רוס | Anser rossii | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
+| 4 | אווז לבן-חזית גדול | Anser albifrons | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
+
+נתחיל על ידי גרף חלק מהנתונים המספריים באמצעות גרף קו בסיסי. נניח שברצונך לראות את מוטת הכנפיים המקסימלית של הציפורים המעניינות הללו.
+
+```python
+wingspan = birds['MaxWingspan']
+wingspan.plot()
+```
+
+
+מה אתה שם לב מיד? נראה שיש לפחות ערך חריג אחד - זו מוטת כנפיים מרשימה! מוטת כנפיים של 2300 סנטימטרים שווה ל-23 מטרים - האם יש פטרודקטילים במינסוטה? בוא נחקור.
+
+בעוד שתוכל לבצע מיון מהיר ב-Excel כדי למצוא את הערכים החריגים, שהם כנראה טעויות הקלדה, המשך תהליך החזותיות מתוך הגרף.
+
+הוסף תוויות לציר ה-x כדי להראות אילו סוגי ציפורים מדובר:
+
+```
+plt.title('Max Wingspan in Centimeters')
+plt.ylabel('Wingspan (CM)')
+plt.xlabel('Birds')
+plt.xticks(rotation=45)
+x = birds['Name']
+y = birds['MaxWingspan']
+
+plt.plot(x, y)
+
+plt.show()
+```
+
+
+גם עם סיבוב התוויות ל-45 מעלות, יש יותר מדי לקרוא. בוא ננסה אסטרטגיה שונה: תווית רק את הערכים החריגים והגדר את התוויות בתוך הגרף. תוכל להשתמש בגרף פיזור כדי ליצור יותר מקום לתוויות:
+
+```python
+plt.title('Max Wingspan in Centimeters')
+plt.ylabel('Wingspan (CM)')
+plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
+
+for i in range(len(birds)):
+ x = birds['Name'][i]
+ y = birds['MaxWingspan'][i]
+ plt.plot(x, y, 'bo')
+ if birds['MaxWingspan'][i] > 500:
+ plt.text(x, y * (1 - 0.05), birds['Name'][i], fontsize=12)
+
+plt.show()
+```
+מה קורה כאן? השתמשת ב-`tick_params` כדי להסתיר את התוויות התחתונות ואז יצרת לולאה על מערך הנתונים של הציפורים שלך. על ידי גרף עם נקודות כחולות קטנות באמצעות `bo`, בדקת אם יש ציפור עם מוטת כנפיים מקסימלית מעל 500 והצגת את התווית שלה ליד הנקודה אם כן. הזזת את התוויות מעט על ציר ה-y (`y * (1 - 0.05)`) והשתמשת בשם הציפור כתווית.
+
+מה גילית?
+
+
+## סינון הנתונים שלך
+
+גם עיטם לבן-ראש וגם בז ערבות, למרות שהם כנראה ציפורים גדולות מאוד, נראים כמתויגים בצורה שגויה, עם `0` נוסף למוטת הכנפיים המקסימלית שלהם. לא סביר שתפגוש עיטם לבן-ראש עם מוטת כנפיים של 25 מטרים, אבל אם כן, אנא הודע לנו! בוא ניצור מערך נתונים חדש ללא שני הערכים החריגים הללו:
+
+```python
+plt.title('Max Wingspan in Centimeters')
+plt.ylabel('Wingspan (CM)')
+plt.xlabel('Birds')
+plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
+for i in range(len(birds)):
+ x = birds['Name'][i]
+ y = birds['MaxWingspan'][i]
+ if birds['Name'][i] not in ['Bald eagle', 'Prairie falcon']:
+ plt.plot(x, y, 'bo')
+plt.show()
+```
+
+על ידי סינון הערכים החריגים, הנתונים שלך עכשיו יותר קוהרנטיים ומובנים.
+
+
+
+עכשיו שיש לנו מערך נתונים נקי לפחות מבחינת מוטת כנפיים, בוא נגלה עוד על הציפורים הללו.
+
+בעוד שגרפי קו ופיזור יכולים להציג מידע על ערכי נתונים והתפלגותם, אנחנו רוצים לחשוב על הערכים הטמונים במערך הנתונים הזה. תוכל ליצור חזותיות כדי לענות על השאלות הבאות על כמויות:
+
+> כמה קטגוריות של ציפורים יש, ומה המספרים שלהן?
+> כמה ציפורים נכחדו, בסכנת הכחדה, נדירות או נפוצות?
+> כמה יש מהסוגים והסדרים השונים במינוח של לינאוס?
+## חקור גרפי עמודות
+
+גרפי עמודות הם מעשיים כאשר אתה צריך להציג קבוצות של נתונים. בוא נחקור את קטגוריות הציפורים הקיימות במערך הנתונים הזה כדי לראות איזו היא הנפוצה ביותר במספר.
+
+בקובץ המחברת, צור גרף עמודות בסיסי.
+
+✅ שים לב, תוכל לסנן את שתי הציפורים החריגות שזיהינו בסעיף הקודם, לערוך את הטעות במוטת הכנפיים שלהן, או להשאיר אותן בתרגילים אלו שאינם תלויים בערכי מוטת כנפיים.
+
+אם ברצונך ליצור גרף עמודות, תוכל לבחור את הנתונים שברצונך להתמקד בהם. גרפי עמודות יכולים להיווצר מנתונים גולמיים:
+
+```python
+birds.plot(x='Category',
+ kind='bar',
+ stacked=True,
+ title='Birds of Minnesota')
+
+```
+
+
+עם זאת, גרף עמודות זה אינו קריא מכיוון שיש יותר מדי נתונים לא מקובצים. עליך לבחור רק את הנתונים שברצונך לגרף, אז בוא נסתכל על אורך הציפורים לפי קטגוריה.
+
+סנן את הנתונים שלך כך שיכללו רק את קטגוריית הציפורים.
+
+✅ שים לב שאתה משתמש ב-Pandas לניהול הנתונים, ואז נותן ל-Matplotlib לבצע את הגרף.
+
+מכיוון שיש הרבה קטגוריות, תוכל להציג את הגרף הזה אנכית ולהתאים את גובהו כדי להתחשב בכל הנתונים:
+
+```python
+category_count = birds.value_counts(birds['Category'].values, sort=True)
+plt.rcParams['figure.figsize'] = [6, 12]
+category_count.plot.barh()
+```
+
+
+גרף עמודות זה מציג מבט טוב על מספר הציפורים בכל קטגוריה. במבט חטוף, אתה רואה שמספר הציפורים הגדול ביותר באזור זה נמצא בקטגוריית ברווזים/אווזים/עופות מים. מינסוטה היא 'ארץ 10,000 האגמים', כך שזה לא מפתיע!
+
+✅ נסה כמה ספירות אחרות על מערך הנתונים הזה. האם משהו מפתיע אותך?
+
+## השוואת נתונים
+
+תוכל לנסות השוואות שונות של נתונים מקובצים על ידי יצירת צירים חדשים. נסה השוואה של אורך מקסימלי של ציפור, בהתבסס על הקטגוריה שלה:
+
+```python
+maxlength = birds['MaxLength']
+plt.barh(y=birds['Category'], width=maxlength)
+plt.rcParams['figure.figsize'] = [6, 12]
+plt.show()
+```
+
+
+שום דבר לא מפתיע כאן: לקוליברים יש אורך מקסימלי קטן ביותר בהשוואה לפליקנים או אווזים. זה טוב כאשר נתונים הגיוניים מבחינה לוגית!
+
+תוכל ליצור חזותיות מעניינות יותר של גרפי עמודות על ידי הצגת נתונים חופפים. בוא נציג את האורך המינימלי והמקסימלי על קטגוריית ציפור נתונה:
+
+```python
+minLength = birds['MinLength']
+maxLength = birds['MaxLength']
+category = birds['Category']
+
+plt.barh(category, maxLength)
+plt.barh(category, minLength)
+
+plt.show()
+```
+בגרף זה, תוכל לראות את הטווח לכל קטגוריית ציפור של האורך המינימלי והמקסימלי. תוכל לומר בבטחה, בהתבסס על נתונים אלו, שככל שהציפור גדולה יותר, טווח האורך שלה גדול יותר. מרתק!
+
+
+
+## 🚀 אתגר
+
+מערך הנתונים של הציפורים הזה מציע שפע של מידע על סוגים שונים של ציפורים בתוך מערכת אקולוגית מסוימת. חפש באינטרנט וראה אם תוכל למצוא מערכי נתונים אחרים הקשורים לציפורים. תרגל יצירת גרפים ודיאגרמות סביב הציפורים הללו כדי לגלות עובדות שלא ידעת.
+
+## [שאלון לאחר השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/17)
+
+## סקירה ולימוד עצמי
+
+השיעור הראשון הזה נתן לך מידע על איך להשתמש ב-Matplotlib כדי להציג כמויות. ערוך מחקר על דרכים אחרות לעבוד עם מערכי נתונים לצורך חזותיות. [Plotly](https://github.com/plotly/plotly.py) היא אחת שלא נסקור בשיעורים אלו, אז תסתכל על מה שהיא יכולה להציע.
+
+## משימה
+
+[קווים, פיזורים ועמודות](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/09-visualization-quantities/assignment.md b/translations/he/3-Data-Visualization/09-visualization-quantities/assignment.md
new file mode 100644
index 00000000..5d5d3e99
--- /dev/null
+++ b/translations/he/3-Data-Visualization/09-visualization-quantities/assignment.md
@@ -0,0 +1,25 @@
+
+# קווים, פיזורים ועמודות
+
+## הוראות
+
+בשיעור זה עבדתם עם גרפים של קווים, גרפים פיזוריים וגרפים עמודתיים כדי להציג עובדות מעניינות על מערך הנתונים הזה. במשימה זו, העמיקו במערך הנתונים כדי לגלות עובדה על סוג מסוים של ציפור. לדוגמה, צרו מחברת שמציגה באופן חזותי את כל הנתונים המעניינים שתוכלו לחשוף על אווזי שלג. השתמשו בשלושת הגרפים שהוזכרו לעיל כדי לספר סיפור במחברת שלכם.
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | --- |
+המחברת מוצגת עם הערות טובות, סיפור ברור וגרפים מושכים | חסר אחד מהאלמנטים הללו במחברת | חסרים שניים מהאלמנטים הללו במחברת
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/10-visualization-distributions/README.md b/translations/he/3-Data-Visualization/10-visualization-distributions/README.md
new file mode 100644
index 00000000..5230119c
--- /dev/null
+++ b/translations/he/3-Data-Visualization/10-visualization-distributions/README.md
@@ -0,0 +1,216 @@
+
+# הצגת התפלגויות
+
+| ](../../sketchnotes/10-Visualizing-Distributions.png)|
+|:---:|
+| הצגת התפלגויות - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+בשיעור הקודם, למדת כמה עובדות מעניינות על מערך נתונים של ציפורים ממינסוטה. זיהית נתונים שגויים על ידי הצגת ערכים חריגים ובחנת את ההבדלים בין קטגוריות הציפורים לפי אורך מקסימלי.
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18)
+## חקר מערך הנתונים של הציפורים
+
+דרך נוספת לחקור נתונים היא על ידי בחינת ההתפלגות שלהם, כלומר איך הנתונים מאורגנים לאורך ציר. אולי, לדוגמה, תרצה ללמוד על ההתפלגות הכללית, עבור מערך הנתונים הזה, של מוטת הכנפיים המקסימלית או מסת הגוף המקסימלית של הציפורים ממינסוטה.
+
+בוא נגלה כמה עובדות על התפלגויות הנתונים במערך הנתונים הזה. בקובץ _notebook.ipynb_ שנמצא בתיקיית השיעור, יבא את Pandas, Matplotlib ואת הנתונים שלך:
+
+```python
+import pandas as pd
+import matplotlib.pyplot as plt
+birds = pd.read_csv('../../data/birds.csv')
+birds.head()
+```
+
+| | שם | שם מדעי | קטגוריה | סדר | משפחה | סוג | מצב שימור | אורך מינימלי | אורך מקסימלי | מסת גוף מינימלית | מסת גוף מקסימלית | מוטת כנפיים מינימלית | מוטת כנפיים מקסימלית |
+| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
+| 0 | ברווז שרוק שחור-בטן | Dendrocygna autumnalis | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
+| 1 | ברווז שרוק חום-בטן | Dendrocygna bicolor | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
+| 2 | אווז שלג | Anser caerulescens | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
+| 3 | אווז רוס | Anser rossii | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
+| 4 | אווז לבן-חזית גדול | Anser albifrons | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
+
+באופן כללי, ניתן להסתכל במהירות על אופן ההתפלגות של הנתונים באמצעות תרשים פיזור כפי שעשינו בשיעור הקודם:
+
+```python
+birds.plot(kind='scatter',x='MaxLength',y='Order',figsize=(12,8))
+
+plt.title('Max Length per Order')
+plt.ylabel('Order')
+plt.xlabel('Max Length')
+
+plt.show()
+```
+
+
+זה נותן סקירה כללית של ההתפלגות הכללית של אורך הגוף לפי סדר הציפורים, אך זו אינה הדרך האופטימלית להציג התפלגויות אמיתיות. משימה זו בדרך כלל מתבצעת באמצעות יצירת היסטוגרמה.
+## עבודה עם היסטוגרמות
+
+Matplotlib מציעה דרכים מצוינות להציג התפלגות נתונים באמצעות היסטוגרמות. סוג תרשים זה דומה לתרשים עמודות שבו ההתפלגות נראית דרך עלייה וירידה של העמודות. כדי לבנות היסטוגרמה, יש צורך בנתונים מספריים. כדי לבנות היסטוגרמה, ניתן ליצור תרשים ולהגדיר את הסוג כ-'hist' עבור היסטוגרמה. תרשים זה מציג את ההתפלגות של MaxBodyMass עבור טווח הנתונים המספריים של מערך הנתונים כולו. על ידי חלוקת מערך הנתונים שהוא מקבל לתאים קטנים יותר, ניתן להציג את ההתפלגות של ערכי הנתונים:
+
+```python
+birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
+plt.show()
+```
+
+
+כפי שניתן לראות, רוב 400+ הציפורים במערך הנתונים הזה נמצאות בטווח של פחות מ-2000 עבור מסת הגוף המקסימלית שלהן. ניתן לקבל תובנות נוספות על הנתונים על ידי שינוי הפרמטר `bins` למספר גבוה יותר, כמו 30:
+
+```python
+birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
+plt.show()
+```
+
+
+תרשים זה מציג את ההתפלגות בצורה מעט יותר מפורטת. ניתן ליצור תרשים פחות מוטה שמאלה על ידי הבטחת בחירת נתונים רק בטווח נתון:
+
+סנן את הנתונים שלך כדי לקבל רק את הציפורים שמסת הגוף שלהן פחות מ-60, והצג 40 `bins`:
+
+```python
+filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]
+filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
+plt.show()
+```
+
+
+✅ נסה מסננים ונקודות נתונים אחרות. כדי לראות את ההתפלגות המלאה של הנתונים, הסר את המסנן `['MaxBodyMass']` כדי להציג התפלגויות מתויגות.
+
+ההיסטוגרמה מציעה גם שיפורים נחמדים בצבע ובתיוג שכדאי לנסות:
+
+צור היסטוגרמה דו-ממדית כדי להשוות את הקשר בין שתי התפלגויות. בוא נשווה `MaxBodyMass` מול `MaxLength`. Matplotlib מציעה דרך מובנית להציג התכנסות באמצעות צבעים בהירים יותר:
+
+```python
+x = filteredBirds['MaxBodyMass']
+y = filteredBirds['MaxLength']
+
+fig, ax = plt.subplots(tight_layout=True)
+hist = ax.hist2d(x, y)
+```
+נראה שיש מתאם צפוי בין שני האלמנטים הללו לאורך ציר צפוי, עם נקודת התכנסות חזקה במיוחד אחת:
+
+
+
+היסטוגרמות עובדות היטב כברירת מחדל עבור נתונים מספריים. מה אם צריך לראות התפלגויות לפי נתונים טקסטואליים?
+## חקר מערך הנתונים להתפלגויות באמצעות נתונים טקסטואליים
+
+מערך הנתונים הזה כולל גם מידע טוב על קטגוריית הציפורים, סוגן, מינן ומשפחתן וכן על מצב השימור שלהן. בוא נחקור את המידע הזה על מצב השימור. מהי ההתפלגות של הציפורים לפי מצב השימור שלהן?
+
+> ✅ במערך הנתונים, נעשה שימוש בכמה ראשי תיבות לתיאור מצב השימור. ראשי תיבות אלו מגיעים מ-[קטגוריות הרשימה האדומה של IUCN](https://www.iucnredlist.org/), ארגון שמקטלג את מצבם של מינים.
+>
+> - CR: בסכנת הכחדה חמורה
+> - EN: בסכנת הכחדה
+> - EX: נכחד
+> - LC: ללא חשש
+> - NT: קרוב לסיכון
+> - VU: פגיע
+
+אלו ערכים מבוססי טקסט ולכן תצטרך לבצע טרנספורמציה כדי ליצור היסטוגרמה. באמצעות מסגרת הנתונים filteredBirds, הצג את מצב השימור שלה לצד מוטת הכנפיים המינימלית שלה. מה אתה רואה?
+
+```python
+x1 = filteredBirds.loc[filteredBirds.ConservationStatus=='EX', 'MinWingspan']
+x2 = filteredBirds.loc[filteredBirds.ConservationStatus=='CR', 'MinWingspan']
+x3 = filteredBirds.loc[filteredBirds.ConservationStatus=='EN', 'MinWingspan']
+x4 = filteredBirds.loc[filteredBirds.ConservationStatus=='NT', 'MinWingspan']
+x5 = filteredBirds.loc[filteredBirds.ConservationStatus=='VU', 'MinWingspan']
+x6 = filteredBirds.loc[filteredBirds.ConservationStatus=='LC', 'MinWingspan']
+
+kwargs = dict(alpha=0.5, bins=20)
+
+plt.hist(x1, **kwargs, color='red', label='Extinct')
+plt.hist(x2, **kwargs, color='orange', label='Critically Endangered')
+plt.hist(x3, **kwargs, color='yellow', label='Endangered')
+plt.hist(x4, **kwargs, color='green', label='Near Threatened')
+plt.hist(x5, **kwargs, color='blue', label='Vulnerable')
+plt.hist(x6, **kwargs, color='gray', label='Least Concern')
+
+plt.gca().set(title='Conservation Status', ylabel='Min Wingspan')
+plt.legend();
+```
+
+
+
+לא נראה שיש מתאם טוב בין מוטת כנפיים מינימלית לבין מצב השימור. בדוק אלמנטים אחרים במערך הנתונים באמצעות שיטה זו. תוכל לנסות מסננים שונים גם כן. האם אתה מוצא מתאם כלשהו?
+
+## תרשימי צפיפות
+
+ייתכן ששמת לב שההיסטוגרמות שראינו עד כה הן 'מדורגות' ואינן זורמות בצורה חלקה בקשת. כדי להציג תרשים צפיפות חלק יותר, תוכל לנסות תרשים צפיפות.
+
+כדי לעבוד עם תרשימי צפיפות, הכיר ספריית תרשימים חדשה, [Seaborn](https://seaborn.pydata.org/generated/seaborn.kdeplot.html).
+
+טען את Seaborn ונסה תרשים צפיפות בסיסי:
+
+```python
+import seaborn as sns
+import matplotlib.pyplot as plt
+sns.kdeplot(filteredBirds['MinWingspan'])
+plt.show()
+```
+
+
+ניתן לראות כיצד התרשים משקף את התרשים הקודם עבור נתוני מוטת כנפיים מינימלית; הוא פשוט מעט חלק יותר. לפי התיעוד של Seaborn, "בהשוואה להיסטוגרמה, KDE יכול ליצור תרשים שהוא פחות עמוס ויותר ניתן לפירוש, במיוחד כאשר מציירים התפלגויות מרובות. אך יש לו פוטנציאל להכניס עיוותים אם ההתפלגות הבסיסית מוגבלת או לא חלקה. כמו בהיסטוגרמה, איכות הייצוג תלויה גם בבחירת פרמטרי החלקה טובים." [מקור](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) במילים אחרות, ערכים חריגים כמו תמיד יגרמו לתרשימים שלך להתנהג בצורה לא טובה.
+
+אם תרצה לחזור לקו המדרגות של MaxBodyMass בתרשים השני שבנית, תוכל להחליק אותו היטב על ידי יצירתו מחדש באמצעות שיטה זו:
+
+```python
+sns.kdeplot(filteredBirds['MaxBodyMass'])
+plt.show()
+```
+
+
+אם תרצה קו חלק, אך לא חלק מדי, ערוך את הפרמטר `bw_adjust`:
+
+```python
+sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
+plt.show()
+```
+
+
+✅ קרא על הפרמטרים הזמינים עבור סוג תרשים זה ונסה להתנסות!
+
+סוג תרשים זה מציע ויזואליזציות מסבירות בצורה יפה. עם כמה שורות קוד, לדוגמה, תוכל להציג את צפיפות מסת הגוף המקסימלית לפי סדר הציפורים:
+
+```python
+sns.kdeplot(
+ data=filteredBirds, x="MaxBodyMass", hue="Order",
+ fill=True, common_norm=False, palette="crest",
+ alpha=.5, linewidth=0,
+)
+```
+
+
+
+תוכל גם למפות את הצפיפות של כמה משתנים בתרשים אחד. בדוק את האורך המקסימלי והמינימלי של ציפור בהשוואה למצב השימור שלה:
+
+```python
+sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")
+```
+
+
+
+אולי כדאי לחקור האם הצבר של ציפורים 'פגיעות' לפי אורכן הוא משמעותי או לא.
+
+## 🚀 אתגר
+
+היסטוגרמות הן סוג תרשים מתוחכם יותר מתרשימי פיזור, עמודות או קווים בסיסיים. חפש באינטרנט דוגמאות טובות לשימוש בהיסטוגרמות. כיצד הן משמשות, מה הן מדגימות, ובאילו תחומים או תחומי מחקר הן נוטות להיות בשימוש?
+
+## [שאלון לאחר השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/19)
+
+## סקירה ולימוד עצמי
+
+בשיעור זה השתמשת ב-Matplotlib והתחלת לעבוד עם Seaborn כדי להציג תרשימים מתוחכמים יותר. ערוך מחקר על `kdeplot` ב-Seaborn, "עקומת צפיפות הסתברות רציפה בממד אחד או יותר". קרא את [התיעוד](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) כדי להבין כיצד הוא עובד.
+
+## משימה
+
+[הפעל את הכישורים שלך](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/10-visualization-distributions/assignment.md b/translations/he/3-Data-Visualization/10-visualization-distributions/assignment.md
new file mode 100644
index 00000000..72d45990
--- /dev/null
+++ b/translations/he/3-Data-Visualization/10-visualization-distributions/assignment.md
@@ -0,0 +1,25 @@
+
+# יישום הכישורים שלך
+
+## הוראות
+
+עד כה עבדת עם מאגר הנתונים של ציפורי מינסוטה כדי לגלות מידע על כמויות ציפורים וצפיפות אוכלוסייה. תרגל את יישום הטכניקות הללו על ידי ניסיון עם מאגר נתונים אחר, אולי ממקור כמו [Kaggle](https://www.kaggle.com/). בנה מחברת שמספרת סיפור על מאגר הנתונים הזה, וודא שאתה משתמש בהיסטוגרמות כאשר אתה דן בו.
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | ---
+מחברת מוצגת עם הערות על מאגר הנתונים הזה, כולל מקורו, ומשתמשת לפחות ב-5 היסטוגרמות כדי לגלות עובדות על הנתונים. | מחברת מוצגת עם הערות לא שלמות או שגיאות. | מחברת מוצגת ללא הערות וכוללת שגיאות.
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/11-visualization-proportions/README.md b/translations/he/3-Data-Visualization/11-visualization-proportions/README.md
new file mode 100644
index 00000000..385790c0
--- /dev/null
+++ b/translations/he/3-Data-Visualization/11-visualization-proportions/README.md
@@ -0,0 +1,204 @@
+
+# ויזואליזציה של יחסים
+
+|](../../sketchnotes/11-Visualizing-Proportions.png)|
+|:---:|
+|ויזואליזציה של יחסים - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+בשיעור הזה, תשתמשו במאגר נתונים ממוקד טבע כדי להמחיש יחסים, כמו כמה סוגים שונים של פטריות מופיעים במאגר נתונים מסוים על פטריות. בואו נחקור את הפטריות המרתקות הללו באמצעות מאגר נתונים שמקורו ב-Audubon, הכולל פרטים על 23 מינים של פטריות עם זימים ממשפחות Agaricus ו-Lepiota. תתנסו בויזואליזציות טעימות כמו:
+
+- גרפי עוגה 🥧
+- גרפי דונאט 🍩
+- גרפי ואפל 🧇
+
+> 💡 פרויקט מעניין מאוד בשם [Charticulator](https://charticulator.com) מבית Microsoft Research מציע ממשק גרירה ושחרור חינמי ליצירת ויזואליזציות של נתונים. באחד המדריכים שלהם הם גם משתמשים במאגר הנתונים הזה על פטריות! כך תוכלו לחקור את הנתונים וללמוד את הספרייה בו-זמנית: [מדריך Charticulator](https://charticulator.com/tutorials/tutorial4.html).
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20)
+
+## הכירו את הפטריות שלכם 🍄
+
+פטריות הן מאוד מעניינות. בואו נייבא מאגר נתונים כדי ללמוד עליהן:
+
+```python
+import pandas as pd
+import matplotlib.pyplot as plt
+mushrooms = pd.read_csv('../../data/mushrooms.csv')
+mushrooms.head()
+```
+טבלה מודפסת עם נתונים נהדרים לניתוח:
+
+| class | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | stalk-root | stalk-surface-above-ring | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
+| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
+| Poisonous | Convex | Smooth | Brown | Bruises | Pungent | Free | Close | Narrow | Black | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
+| Edible | Convex | Smooth | Yellow | Bruises | Almond | Free | Close | Broad | Black | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Grasses |
+| Edible | Bell | Smooth | White | Bruises | Anise | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Meadows |
+| Poisonous | Convex | Scaly | White | Bruises | Pungent | Free | Close | Narrow | Brown | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
+
+מיד שמים לב שכל הנתונים הם טקסטואליים. תצטרכו להמיר את הנתונים הללו כדי שתוכלו להשתמש בהם בגרף. למעשה, רוב הנתונים מיוצגים כאובייקט:
+
+```python
+print(mushrooms.select_dtypes(["object"]).columns)
+```
+
+הפלט הוא:
+
+```output
+Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
+ 'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
+ 'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
+ 'stalk-surface-below-ring', 'stalk-color-above-ring',
+ 'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
+ 'ring-type', 'spore-print-color', 'population', 'habitat'],
+ dtype='object')
+```
+קחו את הנתונים הללו והמירו את עמודת 'class' לקטגוריה:
+
+```python
+cols = mushrooms.select_dtypes(["object"]).columns
+mushrooms[cols] = mushrooms[cols].astype('category')
+```
+
+```python
+edibleclass=mushrooms.groupby(['class']).count()
+edibleclass
+```
+
+עכשיו, אם תדפיסו את נתוני הפטריות, תוכלו לראות שהם חולקו לקטגוריות לפי מחלקת רעילות/אכילות:
+
+| | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | ... | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
+| --------- | --------- | ----------- | --------- | ------- | ---- | --------------- | ------------ | --------- | ---------- | ----------- | --- | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
+| class | | | | | | | | | | | | | | | | | | | | | |
+| Edible | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
+| Poisonous | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
+
+אם תעקבו אחרי הסדר המוצג בטבלה הזו ליצירת תוויות קטגוריות, תוכלו לבנות גרף עוגה:
+
+## עוגה!
+
+```python
+labels=['Edible','Poisonous']
+plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
+plt.title('Edible?')
+plt.show()
+```
+והנה, גרף עוגה שמציג את היחסים בנתונים לפי שתי המחלקות של הפטריות. חשוב מאוד לוודא שהסדר של התוויות נכון, במיוחד כאן, אז בדקו את הסדר שבו נבנית מערך התוויות!
+
+
+
+## דונאט!
+
+גרף עוגה מעניין יותר מבחינה ויזואלית הוא גרף דונאט, שהוא גרף עוגה עם חור במרכז. בואו נסתכל על הנתונים שלנו בשיטה הזו.
+
+הסתכלו על בתי הגידול השונים שבהם פטריות גדלות:
+
+```python
+habitat=mushrooms.groupby(['habitat']).count()
+habitat
+```
+כאן, אתם מקבצים את הנתונים לפי בית גידול. ישנם 7 בתי גידול, אז השתמשו בהם כתוויות לגרף הדונאט שלכם:
+
+```python
+labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
+
+plt.pie(habitat['class'], labels=labels,
+ autopct='%1.1f%%', pctdistance=0.85)
+
+center_circle = plt.Circle((0, 0), 0.40, fc='white')
+fig = plt.gcf()
+
+fig.gca().add_artist(center_circle)
+
+plt.title('Mushroom Habitats')
+
+plt.show()
+```
+
+
+
+הקוד הזה מצייר גרף ומעגל מרכזי, ואז מוסיף את המעגל המרכזי לגרף. ערכו את רוחב המעגל המרכזי על ידי שינוי `0.40` לערך אחר.
+
+ניתן לשנות גרפי דונאט בדרכים שונות כדי לשפר את קריאות התוויות. למדו עוד ב-[תיעוד](https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut).
+
+עכשיו, כשאתם יודעים איך לקבץ את הנתונים שלכם ולהציג אותם כעוגה או דונאט, תוכלו לחקור סוגים אחרים של גרפים. נסו גרף ואפל, שהוא פשוט דרך שונה להמחשת כמויות.
+
+## ואפל!
+
+גרף מסוג 'ואפל' הוא דרך שונה להמחיש כמויות כטבלה דו-ממדית של ריבועים. נסו להמחיש את הכמויות השונות של צבעי כובע הפטריות במאגר הנתונים הזה. לשם כך, תצטרכו להתקין ספריית עזר בשם [PyWaffle](https://pypi.org/project/pywaffle/) ולהשתמש ב-Matplotlib:
+
+```python
+pip install pywaffle
+```
+
+בחרו קטע מהנתונים שלכם לקיבוץ:
+
+```python
+capcolor=mushrooms.groupby(['cap-color']).count()
+capcolor
+```
+
+צרו גרף ואפל על ידי יצירת תוויות ואז קיבוץ הנתונים שלכם:
+
+```python
+import pandas as pd
+import matplotlib.pyplot as plt
+from pywaffle import Waffle
+
+data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
+ 'amount': capcolor['class']
+ }
+
+df = pd.DataFrame(data)
+
+fig = plt.figure(
+ FigureClass = Waffle,
+ rows = 100,
+ values = df.amount,
+ labels = list(df.color),
+ figsize = (30,30),
+ colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
+)
+```
+
+באמצעות גרף ואפל, ניתן לראות בבירור את היחסים של צבעי כובעי הפטריות במאגר הנתונים הזה. מעניין, ישנן פטריות רבות עם כובעים ירוקים!
+
+
+
+✅ PyWaffle תומכת באייקונים בתוך הגרפים שמשתמשים בכל אייקון זמין ב-[Font Awesome](https://fontawesome.com/). נסו לערוך ניסויים וליצור גרף ואפל מעניין יותר באמצעות אייקונים במקום ריבועים.
+
+בשיעור הזה, למדתם שלוש דרכים להמחיש יחסים. ראשית, עליכם לקבץ את הנתונים שלכם לקטגוריות ואז להחליט מהי הדרך הטובה ביותר להציג את הנתונים - עוגה, דונאט, או ואפל. כל הדרכים טעימות ומספקות למשתמש תמונת מצב מיידית של מאגר הנתונים.
+
+## 🚀 אתגר
+
+נסו ליצור מחדש את הגרפים הטעימים הללו ב-[Charticulator](https://charticulator.com).
+## [שאלון אחרי השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21)
+
+## סקירה ולימוד עצמי
+
+לפעמים לא ברור מתי להשתמש בגרף עוגה, דונאט, או ואפל. הנה כמה מאמרים לקריאה בנושא:
+
+https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
+
+https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
+
+https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
+
+https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
+
+בצעו מחקר נוסף כדי למצוא מידע נוסף על ההחלטה המורכבת הזו.
+
+## משימה
+
+[נסו את זה ב-Excel](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/11-visualization-proportions/assignment.md b/translations/he/3-Data-Visualization/11-visualization-proportions/assignment.md
new file mode 100644
index 00000000..cbbd1bbe
--- /dev/null
+++ b/translations/he/3-Data-Visualization/11-visualization-proportions/assignment.md
@@ -0,0 +1,25 @@
+
+# נסה את זה ב-Excel
+
+## הוראות
+
+האם ידעת שאתה יכול ליצור תרשימי דונאט, פאי, וופל ב-Excel? באמצעות מערך נתונים לבחירתך, צור את שלושת התרשימים הללו ישירות בגיליון אלקטרוני של Excel.
+
+## קריטריונים להערכה
+
+| מצטיין | מספק | דורש שיפור |
+| ----------------------------------------------------- | --------------------------------------------- | ------------------------------------------------- |
+| מוצג גיליון אלקטרוני של Excel עם כל שלושת התרשימים | מוצג גיליון אלקטרוני של Excel עם שני תרשימים | מוצג גיליון אלקטרוני של Excel עם תרשים אחד בלבד |
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/12-visualization-relationships/README.md b/translations/he/3-Data-Visualization/12-visualization-relationships/README.md
new file mode 100644
index 00000000..4aebef17
--- /dev/null
+++ b/translations/he/3-Data-Visualization/12-visualization-relationships/README.md
@@ -0,0 +1,186 @@
+
+# חזותיות של קשרים: הכל על דבש 🍯
+
+| ](../../sketchnotes/12-Visualizing-Relationships.png)|
+|:---:|
+|חזותיות של קשרים - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+בהמשך להתמקדות שלנו בטבע במחקר, בואו נגלה חזותיות מעניינות שמציגות את הקשרים בין סוגי דבש שונים, על פי מערך נתונים שמקורו ב-[משרד החקלאות של ארצות הברית](https://www.nass.usda.gov/About_NASS/index.php).
+
+מערך הנתונים הזה, שמכיל כ-600 פריטים, מציג את ייצור הדבש במדינות רבות בארצות הברית. לדוגמה, ניתן לבחון את מספר הכוורות, התפוקה לכל כוורת, הייצור הכולל, המלאי, המחיר לקילוגרם, והערך של הדבש שיוצר במדינה מסוימת בין השנים 1998-2012, עם שורה אחת לכל שנה עבור כל מדינה.
+
+יהיה מעניין להציג חזותית את הקשר בין ייצור הדבש במדינה מסוימת בשנה נתונה לבין, לדוגמה, המחיר של הדבש באותה מדינה. לחלופין, ניתן להציג את הקשר בין תפוקת הדבש לכל כוורת במדינות השונות. טווח השנים הזה כולל את התופעה ההרסנית 'CCD' או 'קריסת מושבות' שנצפתה לראשונה בשנת 2006 (http://npic.orst.edu/envir/ccd.html), ולכן זהו מערך נתונים מרגש ללימוד. 🐝
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/22)
+
+בשיעור הזה, תוכלו להשתמש ב-Seaborn, ספרייה שכבר השתמשתם בה בעבר, כדי להציג חזותית קשרים בין משתנים. במיוחד מעניין להשתמש בפונקציה `relplot` של Seaborn, שמאפשרת ליצור גרפים פזורים וגרפי קווים כדי להציג במהירות '[קשרים סטטיסטיים](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)', שמאפשרים למדען הנתונים להבין טוב יותר כיצד משתנים קשורים זה לזה.
+
+## גרפים פזורים
+
+השתמשו בגרף פזור כדי להציג כיצד המחיר של הדבש התפתח משנה לשנה, לפי מדינה. Seaborn, באמצעות `relplot`, מקבץ בנוחות את נתוני המדינות ומציג נקודות נתונים עבור נתונים קטגוריים ומספריים כאחד.
+
+נתחיל בייבוא הנתונים ו-Seaborn:
+
+```python
+import pandas as pd
+import matplotlib.pyplot as plt
+import seaborn as sns
+honey = pd.read_csv('../../data/honey.csv')
+honey.head()
+```
+שימו לב שמערך הנתונים של הדבש כולל כמה עמודות מעניינות, כולל שנה ומחיר לקילוגרם. בואו נחקור את הנתונים האלה, מקובצים לפי מדינות בארצות הברית:
+
+| מדינה | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
+| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
+| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
+| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
+| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
+| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
+| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
+
+צרו גרף פזור בסיסי כדי להציג את הקשר בין המחיר לקילוגרם של דבש לבין מדינת המקור שלו. הפכו את ציר ה-`y` לגבוה מספיק כדי להציג את כל המדינות:
+
+```python
+sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
+```
+
+
+כעת, הציגו את אותם נתונים עם ערכת צבעים של דבש כדי להראות כיצד המחיר מתפתח לאורך השנים. ניתן לעשות זאת על ידי הוספת פרמטר 'hue' כדי להציג את השינוי משנה לשנה:
+
+> ✅ למדו עוד על [ערכות הצבעים שניתן להשתמש בהן ב-Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - נסו ערכת צבעים יפהפייה של קשת!
+
+```python
+sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5);
+```
+
+
+עם שינוי ערכת הצבעים, ניתן לראות בבירור התקדמות חזקה לאורך השנים מבחינת המחיר לקילוגרם של דבש. למעשה, אם תבדקו קבוצת נתונים לדוגמה כדי לאמת (בחרו מדינה מסוימת, למשל אריזונה), תוכלו לראות דפוס של עליית מחירים משנה לשנה, עם מעט יוצאים מן הכלל:
+
+| מדינה | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
+| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
+| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
+| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
+| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
+| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
+| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
+| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
+| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
+| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
+| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
+| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
+| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
+| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
+| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
+| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
+| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
+
+דרך נוספת להציג את ההתקדמות הזו היא להשתמש בגודל במקום בצבע. עבור משתמשים עיוורי צבעים, זו עשויה להיות אפשרות טובה יותר. ערכו את החזותיות שלכם כדי להציג עלייה במחיר באמצעות עלייה בהיקף הנקודות:
+
+```python
+sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5);
+```
+ניתן לראות את גודל הנקודות גדל בהדרגה.
+
+
+
+האם מדובר במקרה פשוט של היצע וביקוש? בשל גורמים כמו שינויי אקלים וקריסת מושבות, האם יש פחות דבש זמין לרכישה משנה לשנה, ולכן המחיר עולה?
+
+כדי לגלות קשר בין כמה מהמשתנים במערך הנתונים הזה, בואו נחקור כמה גרפי קווים.
+
+## גרפי קווים
+
+שאלה: האם יש עלייה ברורה במחיר הדבש לקילוגרם משנה לשנה? ניתן לגלות זאת בקלות על ידי יצירת גרף קו יחיד:
+
+```python
+sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
+```
+תשובה: כן, עם כמה יוצאים מן הכלל סביב שנת 2003:
+
+
+
+✅ מכיוון ש-Seaborn מאגד נתונים סביב קו אחד, הוא מציג "את המדידות המרובות בכל ערך x על ידי שרטוט הממוצע והאינטרוול של 95% סביב הממוצע". [מקור](https://seaborn.pydata.org/tutorial/relational.html). ניתן לבטל את ההתנהגות הזו על ידי הוספת `ci=None`.
+
+שאלה: ובכן, בשנת 2003 האם ניתן לראות גם עלייה בהיצע הדבש? מה אם תסתכלו על הייצור הכולל משנה לשנה?
+
+```python
+sns.relplot(x="year", y="totalprod", kind="line", data=honey);
+```
+
+
+
+תשובה: לא ממש. אם תסתכלו על הייצור הכולל, נראה שהוא דווקא עלה בשנה הזו, למרות שבאופן כללי כמות הדבש שמיוצרת נמצאת בירידה במהלך השנים הללו.
+
+שאלה: במקרה כזה, מה יכול היה לגרום לעלייה במחיר הדבש סביב שנת 2003?
+
+כדי לגלות זאת, ניתן לחקור רשתות פן.
+
+## רשתות פן
+
+רשתות פן לוקחות פן אחד ממערך הנתונים שלכם (במקרה שלנו, ניתן לבחור 'שנה' כדי להימנע מיצירת יותר מדי פן). Seaborn יכול ליצור גרף עבור כל אחד מהפן של הקואורדינטות x ו-y שבחרתם להשוואה קלה יותר. האם שנת 2003 בולטת בהשוואה מסוג זה?
+
+צרו רשת פן על ידי המשך השימוש ב-`relplot` כפי שמומלץ על ידי [התיעוד של Seaborn](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
+
+```python
+sns.relplot(
+ data=honey,
+ x="yieldpercol", y="numcol",
+ col="year",
+ col_wrap=3,
+ kind="line"
+```
+בחזותיות הזו, ניתן להשוות את התפוקה לכל כוורת ומספר הכוורות משנה לשנה, זו לצד זו עם הגדרה של wrap ל-3 עבור העמודות:
+
+
+
+עבור מערך הנתונים הזה, שום דבר לא בולט במיוחד בכל הנוגע למספר הכוורות והתפוקה שלהן, משנה לשנה ומדינה למדינה. האם יש דרך אחרת לחפש קשר בין שני המשתנים הללו?
+
+## גרפי קווים כפולים
+
+נסו גרף רב-קווי על ידי העלאת שני גרפי קווים זה על גבי זה, תוך שימוש ב-'despine' של Seaborn להסרת הקוצים העליונים והימניים שלהם, ושימוש ב-`ax.twinx` [שמקורו ב-Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx מאפשר לגרף לשתף את ציר ה-x ולהציג שני צירי y. אז, הציגו את התפוקה לכל כוורת ומספר הכוורות, זה על גבי זה:
+
+```python
+fig, ax = plt.subplots(figsize=(12,6))
+lineplot = sns.lineplot(x=honey['year'], y=honey['numcol'], data=honey,
+ label = 'Number of bee colonies', legend=False)
+sns.despine()
+plt.ylabel('# colonies')
+plt.title('Honey Production Year over Year');
+
+ax2 = ax.twinx()
+lineplot2 = sns.lineplot(x=honey['year'], y=honey['yieldpercol'], ax=ax2, color="r",
+ label ='Yield per colony', legend=False)
+sns.despine(right=False)
+plt.ylabel('colony yield')
+ax.figure.legend();
+```
+
+
+למרות ששום דבר לא קופץ לעין סביב שנת 2003, זה מאפשר לנו לסיים את השיעור הזה בנימה מעט שמחה יותר: למרות שיש ירידה כללית במספר הכוורות, מספר הכוורות מתייצב גם אם התפוקה שלהן לכל כוורת יורדת.
+
+קדימה, דבורים, קדימה!
+
+🐝❤️
+## 🚀 אתגר
+
+בשיעור הזה, למדתם קצת יותר על שימושים אחרים של גרפים פזורים ורשתות קווים, כולל רשתות פן. אתגרו את עצמכם ליצור רשת פן באמצעות מערך נתונים אחר, אולי כזה שהשתמשתם בו לפני השיעורים הללו. שימו לב כמה זמן לוקח ליצור אותם וכיצד עליכם להיזהר בכמות הרשתות שאתם צריכים לצייר באמצעות הטכניקות הללו.
+## [שאלון אחרי השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/23)
+
+## סקירה ולימוד עצמי
+
+גרפי קווים יכולים להיות פשוטים או מורכבים למדי. עשו קצת קריאה בתיעוד של [Seaborn](https://seaborn.pydata.org/generated/seaborn.lineplot.html) על הדרכים השונות שבהן ניתן לבנות אותם. נסו לשפר את גרפי הקווים שבניתם בשיעור הזה עם שיטות אחרות שמופיעות בתיעוד.
+## משימה
+
+[צללו לתוך הכוורת](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/12-visualization-relationships/assignment.md b/translations/he/3-Data-Visualization/12-visualization-relationships/assignment.md
new file mode 100644
index 00000000..30c55d07
--- /dev/null
+++ b/translations/he/3-Data-Visualization/12-visualization-relationships/assignment.md
@@ -0,0 +1,25 @@
+
+# צלילה אל תוך הכוורת
+
+## הוראות
+
+בשיעור זה התחלתם לבחון מערך נתונים הקשור לדבורים ולייצור הדבש שלהן לאורך תקופה שבה נרשמו ירידות באוכלוסיית מושבות הדבורים באופן כללי. העמיקו במערך הנתונים הזה ובנו מחברת שיכולה לספר את סיפור מצב בריאות אוכלוסיית הדבורים, מדינה אחר מדינה ושנה אחר שנה. האם אתם מגלים משהו מעניין במערך הנתונים הזה?
+
+## קריטריונים להערכה
+
+| מצטיין | מספק | דורש שיפור |
+| ------------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------- | --------------------------------------- |
+| מוצגת מחברת עם סיפור שמלווה בלפחות שלושה גרפים שונים המראים היבטים של מערך הנתונים, מדינה אחר מדינה ושנה אחר שנה | המחברת חסרה אחד מהאלמנטים הללו | המחברת חסרה שניים מהאלמנטים הללו |
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/13-meaningful-visualizations/README.md b/translations/he/3-Data-Visualization/13-meaningful-visualizations/README.md
new file mode 100644
index 00000000..d1eba171
--- /dev/null
+++ b/translations/he/3-Data-Visualization/13-meaningful-visualizations/README.md
@@ -0,0 +1,182 @@
+
+# יצירת ויזואליזציות משמעותיות
+
+|](../../sketchnotes/13-MeaningfulViz.png)|
+|:---:|
+| ויזואליזציות משמעותיות - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+> "אם תענה את הנתונים מספיק זמן, הם יתוודו על כל דבר" -- [רונלד קואז](https://en.wikiquote.org/wiki/Ronald_Coase)
+
+אחת המיומנויות הבסיסיות של מדען נתונים היא היכולת ליצור ויזואליזציה משמעותית של נתונים שעוזרת לענות על שאלות שעולות. לפני שתתחיל ליצור ויזואליזציה, עליך לוודא שהנתונים נוקו והוכנו, כפי שעשית בשיעורים הקודמים. לאחר מכן, תוכל להתחיל להחליט כיצד להציג את הנתונים בצורה הטובה ביותר.
+
+בשיעור זה תסקור:
+
+1. כיצד לבחור את סוג הגרף הנכון
+2. כיצד להימנע מגרפים מטעים
+3. כיצד לעבוד עם צבע
+4. כיצד לעצב את הגרפים שלך לקריאות
+5. כיצד לבנות פתרונות גרפיים מונפשים או תלת-ממדיים
+6. כיצד ליצור ויזואליזציה יצירתית
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/24)
+
+## בחירת סוג הגרף הנכון
+
+בשיעורים קודמים התנסית ביצירת כל מיני ויזואליזציות מעניינות באמצעות Matplotlib ו-Seaborn. באופן כללי, תוכל לבחור את [סוג הגרף הנכון](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) לשאלה שאתה שואל באמצעות הטבלה הבאה:
+
+| מה אתה צריך להציג: | סוג הגרף המומלץ: |
+| -------------------------- | ----------------------------- |
+| להראות מגמות לאורך זמן | קו |
+| להשוות קטגוריות | עמודות, עוגה |
+| להשוות סך הכל | עוגה, עמודות מוערמות |
+| להראות קשרים | פיזור, קו, פיצול, קו כפול |
+| להראות התפלגויות | פיזור, היסטוגרמה, תיבה |
+| להראות פרופורציות | עוגה, דונאט, וופל |
+
+> ✅ בהתאם למבנה הנתונים שלך, ייתכן שתצטרך להמיר אותם מטקסט למספרים כדי לתמוך בסוג הגרף הרצוי.
+
+## הימנעות מהטעיה
+
+גם אם מדען הנתונים בוחר את הגרף הנכון לנתונים הנכונים, ישנן דרכים רבות שבהן ניתן להציג נתונים באופן שמוכיח נקודה מסוימת, לעיתים על חשבון האמת שבנתונים עצמם. ישנם דוגמאות רבות לגרפים ואינפוגרפיקות מטעים!
+
+[](https://www.youtube.com/watch?v=oX74Nge8Wkw "איך גרפים משקרים")
+
+> 🎥 לחץ על התמונה למעלה לצפייה בהרצאה על גרפים מטעים
+
+הגרף הזה הופך את ציר ה-X כדי להציג את ההפך מהאמת, בהתבסס על תאריכים:
+
+
+
+[הגרף הזה](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) מטעה עוד יותר, שכן העין נמשכת ימינה ומסיקה שמספר מקרי הקורונה ירד לאורך זמן במחוזות השונים. למעשה, אם תסתכל מקרוב על התאריכים, תמצא שהם סודרו מחדש כדי ליצור מגמת ירידה מטעה.
+
+
+
+הדוגמה הידועה לשמצה הזו משתמשת בצבע ובציר Y הפוך כדי להטעות: במקום להסיק שמקרי המוות מנשק עלו לאחר חקיקת חוקים ידידותיים לנשק, העין מתעתעת לחשוב שההפך הוא הנכון:
+
+
+
+הגרף המוזר הזה מראה כיצד ניתן לעוות פרופורציות, לעיתים בצורה משעשעת:
+
+
+
+השוואת דברים שאינם ברי השוואה היא עוד טריק מפוקפק. ישנו [אתר נפלא](https://tylervigen.com/spurious-correlations) שמציג 'מתאמים שקריים' עם 'עובדות' שמקשרות בין דברים כמו שיעור הגירושין במיין לצריכת מרגרינה. קבוצת Reddit גם אוספת [שימושים מכוערים](https://www.reddit.com/r/dataisugly/top/?t=all) בנתונים.
+
+חשוב להבין עד כמה קל להטעות את העין באמצעות גרפים מטעים. גם אם כוונת מדען הנתונים טובה, בחירה בסוג גרף לא מתאים, כמו גרף עוגה עם יותר מדי קטגוריות, יכולה להטעות.
+
+## צבע
+
+כפי שראית בגרף 'אלימות נשק בפלורידה', צבע יכול להוסיף שכבה נוספת של משמעות לגרפים, במיוחד כאלה שלא עוצבו באמצעות ספריות כמו Matplotlib ו-Seaborn שמגיעות עם פלטות צבעים מאומתות. אם אתה יוצר גרף ידני, כדאי ללמוד מעט על [תורת הצבעים](https://colormatters.com/color-and-design/basic-color-theory).
+
+> ✅ זכור שבעיצוב גרפים, נגישות היא היבט חשוב. חלק מהמשתמשים שלך עשויים להיות עיוורי צבעים - האם הגרף שלך מוצג היטב עבור משתמשים עם לקויות ראייה?
+
+היה זהיר בבחירת צבעים לגרף שלך, שכן צבע יכול להעביר משמעות שלא התכוונת אליה. לדוגמה, ה'נשים הוורודות' בגרף 'גובה' למעלה מעבירות משמעות 'נשית' שמוסיפה למוזרות של הגרף עצמו.
+
+בעוד ש[משמעות הצבעים](https://colormatters.com/color-symbolism/the-meanings-of-colors) עשויה להשתנות בין תרבויות שונות, ובדרך כלל משתנה בהתאם לגוון, המשמעויות הכלליות כוללות:
+
+| צבע | משמעות |
+| ------ | -------------------- |
+| אדום | כוח |
+| כחול | אמון, נאמנות |
+| צהוב | שמחה, זהירות |
+| ירוק | אקולוגיה, מזל, קנאה |
+| סגול | שמחה |
+| כתום | חיוניות |
+
+אם אתה מתבקש לבנות גרף עם צבעים מותאמים אישית, ודא שהגרפים שלך גם נגישים וגם שהצבעים שבחרת תואמים את המשמעות שאתה מנסה להעביר.
+
+## עיצוב גרפים לקריאות
+
+גרפים אינם משמעותיים אם הם אינם קריאים! הקדש רגע לשקול את עיצוב הרוחב והגובה של הגרף כך שיתאים לנתונים שלך. אם יש צורך להציג משתנה אחד (כמו כל 50 המדינות), הצג אותם אנכית על ציר ה-Y אם אפשר, כדי להימנע מגרף שדורש גלילה אופקית.
+
+תייג את הצירים שלך, ספק מקרא במידת הצורך, והצע טיפים להבנה טובה יותר של הנתונים.
+
+אם הנתונים שלך טקסטואליים וארוכים בציר ה-X, תוכל להטות את הטקסט לקריאות טובה יותר. [Matplotlib](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) מציעה גרפים תלת-ממדיים אם הנתונים שלך תומכים בכך. ניתן ליצור ויזואליזציות מתקדמות באמצעות `mpl_toolkits.mplot3d`.
+
+
+
+## אנימציה ותצוגת גרפים תלת-ממדיים
+
+חלק מהויזואליזציות הטובות ביותר כיום הן מונפשות. שירלי וו יצרה ויזואליזציות מדהימות עם D3, כמו '[פרחי סרטים](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', שבה כל פרח הוא ויזואליזציה של סרט. דוגמה נוספת עבור ה-Guardian היא 'בוסים החוצה', חוויה אינטראקטיבית שמשלבת ויזואליזציות עם Greensock ו-D3 יחד עם מאמר סיפור גלילה שמראה כיצד ניו יורק מתמודדת עם בעיית חסרי הבית שלה על ידי שליחתם מחוץ לעיר.
+
+
+
+> "בוסים החוצה: כיצד אמריקה מזיזה את חסרי הבית שלה" מתוך [הגרדיאן](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). ויזואליזציות מאת נדיה ברמר ושירלי וו
+
+בעוד שהשיעור הזה אינו מספיק מעמיק כדי ללמד את הספריות החזקות הללו, נסה את כוחך ב-D3 באפליקציית Vue.js באמצעות ספרייה להצגת ויזואליזציה של הספר "יחסים מסוכנים" כרשת חברתית מונפשת.
+
+> "יחסים מסוכנים" הוא רומן אפיסטולרי, או רומן שמוצג כסדרת מכתבים. נכתב ב-1782 על ידי שודרלו דה לאקלו, הוא מספר את סיפורם של שני גיבורים אריסטוקרטיים צרפתיים מהמאה ה-18, הוויקונט דה ואלמון והמרקיזה דה מרטיי. שניהם מוצאים את סופם בסוף, אך לא לפני שהם גורמים לנזק חברתי רב. הרומן מתפתח כסדרת מכתבים שנכתבים לאנשים שונים במעגלים שלהם, מתוך כוונה לנקמה או פשוט כדי לגרום לצרות. צור ויזואליזציה של המכתבים הללו כדי לגלות את הדמויות המרכזיות בסיפור, באופן חזותי.
+
+תשלים אפליקציית רשת שתציג תצוגה מונפשת של הרשת החברתית הזו. היא משתמשת בספרייה שנבנתה ליצירת [ויזואליזציה של רשת](https://github.com/emiliorizzo/vue-d3-network) באמצעות Vue.js ו-D3. כשהאפליקציה פועלת, תוכל לגרור את הצמתים על המסך כדי לשנות את מיקומם.
+
+
+
+## פרויקט: בניית גרף להצגת רשת באמצעות D3.js
+
+> תיקיית השיעור כוללת תיקיית `solution` שבה תוכל למצוא את הפרויקט המושלם, לעיונך.
+
+1. עקוב אחר ההוראות בקובץ README.md בתיקיית ה-starter. ודא שיש לך NPM ו-Node.js מותקנים במחשב שלך לפני התקנת התלויות של הפרויקט.
+
+2. פתח את התיקייה `starter/src`. תמצא שם תיקיית `assets` שבה קובץ .json עם כל המכתבים מהרומן, ממוספרים, עם תיוג 'to' ו-'from'.
+
+3. השלם את הקוד ב-`components/Nodes.vue` כדי לאפשר את הויזואליזציה. חפש את הפונקציה `createLinks()` והוסף את הלולאה המקוננת הבאה.
+
+לולא דרך אובייקט ה-json כדי ללכוד את נתוני ה-'to' וה-'from' של המכתבים ולבנות את אובייקט ה-`links` כך שהספרייה תוכל לצרוך אותו:
+
+```javascript
+//loop through letters
+ let f = 0;
+ let t = 0;
+ for (var i = 0; i < letters.length; i++) {
+ for (var j = 0; j < characters.length; j++) {
+
+ if (characters[j] == letters[i].from) {
+ f = j;
+ }
+ if (characters[j] == letters[i].to) {
+ t = j;
+ }
+ }
+ this.links.push({ sid: f, tid: t });
+ }
+ ```
+
+הרץ את האפליקציה שלך מהטרמינל (npm run serve) ותהנה מהויזואליזציה!
+
+## 🚀 אתגר
+
+צא לסיור באינטרנט כדי לגלות ויזואליזציות מטעות. כיצד המחבר מטעה את המשתמש, והאם זה נעשה בכוונה? נסה לתקן את הויזואליזציות כדי להראות כיצד הן אמורות להיראות.
+
+## [שאלון לאחר השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/25)
+
+## סקירה ולימוד עצמי
+
+הנה כמה מאמרים לקריאה על ויזואליזציות נתונים מטעות:
+
+https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
+
+http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
+
+עיין בויזואליזציות מעניינות לנכסים וחפצים היסטוריים:
+
+https://handbook.pubpub.org/
+
+עיין במאמר הזה על איך אנימציה יכולה לשפר את הויזואליזציות שלך:
+
+https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
+
+## משימה
+
+[צור ויזואליזציה מותאמת אישית משלך](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/13-meaningful-visualizations/assignment.md b/translations/he/3-Data-Visualization/13-meaningful-visualizations/assignment.md
new file mode 100644
index 00000000..df211f61
--- /dev/null
+++ b/translations/he/3-Data-Visualization/13-meaningful-visualizations/assignment.md
@@ -0,0 +1,25 @@
+
+# בנה ויזואליזציה מותאמת אישית משלך
+
+## הוראות
+
+באמצעות דוגמת הקוד בפרויקט זה, צור רשת חברתית והשתמש בנתונים המדמים את האינטראקציות החברתיות שלך. תוכל למפות את השימוש שלך במדיה חברתית או ליצור דיאגרמה של בני משפחתך. צור אפליקציית אינטרנט מעניינת שמציגה ויזואליזציה ייחודית של רשת חברתית.
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | ---
+מוצג מאגר GitHub עם קוד שפועל כראוי (נסה לפרוס אותו כאפליקציית אינטרנט סטטית) ויש בו README עם הסברים על הפרויקט | המאגר אינו פועל כראוי או אינו מתועד היטב | המאגר אינו פועל כראוי וגם אינו מתועד היטב
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/13-meaningful-visualizations/solution/README.md b/translations/he/3-Data-Visualization/13-meaningful-visualizations/solution/README.md
new file mode 100644
index 00000000..8ee9fddc
--- /dev/null
+++ b/translations/he/3-Data-Visualization/13-meaningful-visualizations/solution/README.md
@@ -0,0 +1,40 @@
+
+# פרויקט ויזואליזציה של נתונים - Dangerous Liaisons
+
+כדי להתחיל, יש לוודא ש-NPM ו-Node מותקנים ופועלים על המחשב שלך. התקן את התלויות (npm install) ולאחר מכן הרץ את הפרויקט באופן מקומי (npm run serve):
+
+## הגדרת הפרויקט
+```
+npm install
+```
+
+### קומפילציה וטעינה מחדש בזמן פיתוח
+```
+npm run serve
+```
+
+### קומפילציה ומזעור עבור הפקה
+```
+npm run build
+```
+
+### בדיקת קוד ותיקון קבצים
+```
+npm run lint
+```
+
+### התאמה אישית של ההגדרות
+ראה [Configuration Reference](https://cli.vuejs.org/config/).
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/13-meaningful-visualizations/starter/README.md b/translations/he/3-Data-Visualization/13-meaningful-visualizations/starter/README.md
new file mode 100644
index 00000000..08170a62
--- /dev/null
+++ b/translations/he/3-Data-Visualization/13-meaningful-visualizations/starter/README.md
@@ -0,0 +1,40 @@
+
+# פרויקט ויזואליזציה של נתונים - Dangerous Liaisons
+
+כדי להתחיל, עליך לוודא ש-NPM ו-Node פועלים על המחשב שלך. התקן את התלויות (npm install) ולאחר מכן הרץ את הפרויקט באופן מקומי (npm run serve):
+
+## הגדרת הפרויקט
+```
+npm install
+```
+
+### קומפילציה וטעינה מחדש בזמן פיתוח
+```
+npm run serve
+```
+
+### קומפילציה ומזעור עבור פרודקשן
+```
+npm run build
+```
+
+### בדיקת קוד ותיקון קבצים
+```
+npm run lint
+```
+
+### התאמה אישית של ההגדרות
+ראה [Configuration Reference](https://cli.vuejs.org/config/).
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/R/09-visualization-quantities/README.md b/translations/he/3-Data-Visualization/R/09-visualization-quantities/README.md
new file mode 100644
index 00000000..1657a7e3
--- /dev/null
+++ b/translations/he/3-Data-Visualization/R/09-visualization-quantities/README.md
@@ -0,0 +1,231 @@
+
+# ויזואליזציה של כמויות
+|](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/09-Visualizing-Quantities.png)|
+|:---:|
+| ויזואליזציה של כמויות - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+בשיעור זה תלמדו כיצד להשתמש בכמה מהספריות הרבות הזמינות ב-R כדי ליצור ויזואליזציות מעניינות סביב מושג הכמות. באמצעות מערך נתונים נקי על ציפורים ממינסוטה, תוכלו ללמוד עובדות מעניינות רבות על חיי הבר המקומיים.
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/16)
+
+## התבוננות במוטת כנפיים עם ggplot2
+ספרייה מצוינת ליצירת גרפים ותרשימים פשוטים ומורכבים מסוגים שונים היא [ggplot2](https://cran.r-project.org/web/packages/ggplot2/index.html). באופן כללי, תהליך יצירת גרפים באמצעות ספריות אלו כולל זיהוי החלקים במערך הנתונים שברצונכם למקד, ביצוע טרנספורמציות נחוצות על הנתונים, הקצאת ערכי ציר x ו-y, בחירת סוג הגרף להצגה, ואז הצגת הגרף.
+
+`ggplot2` היא מערכת ליצירת גרפיקה באופן דקלרטיבי, המבוססת על "דקדוק הגרפיקה". [דקדוק הגרפיקה](https://en.wikipedia.org/wiki/Ggplot2) הוא שיטה כללית לויזואליזציה של נתונים שמפרקת גרפים לרכיבים סמנטיים כמו סולמות ושכבות. במילים אחרות, הקלות שבה ניתן ליצור גרפים ותרשימים לנתונים חד-משתניים או רב-משתניים עם מעט קוד הופכת את `ggplot2` לחבילה הפופולרית ביותר לויזואליזציה ב-R. המשתמש מציין ל-`ggplot2` כיצד למפות את המשתנים לאסתטיקה, אילו פרימיטיבים גרפיים להשתמש, ו-`ggplot2` מטפלת בשאר.
+
+> ✅ גרף = נתונים + אסתטיקה + גיאומטריה
+> - נתונים מתייחסים למערך הנתונים
+> - אסתטיקה מציינת את המשתנים הנחקרים (משתני x ו-y)
+> - גיאומטריה מתייחסת לסוג הגרף (גרף קווי, גרף עמודות וכו')
+
+בחרו את הגיאומטריה המתאימה (סוג הגרף) בהתאם לנתונים ולסיפור שברצונכם לספר באמצעות הגרף.
+
+> - לניתוח מגמות: קו, עמודות
+> - להשוואת ערכים: עמודות, עוגה, פיזור
+> - להראות כיצד חלקים קשורים לשלם: עוגה
+> - להראות התפלגות נתונים: פיזור, עמודות
+> - להראות קשרים בין ערכים: קו, פיזור, בועה
+
+✅ תוכלו גם לעיין ב[דף עזר](https://nyu-cdsc.github.io/learningr/assets/data-visualization-2.1.pdf) המתאר את ggplot2.
+
+## יצירת גרף קווי על ערכי מוטת כנפיים של ציפורים
+
+פתחו את קונסולת R וייבאו את מערך הנתונים.
+> הערה: מערך הנתונים מאוחסן בתיקיית `/data` בשורש המאגר.
+
+ייבאו את מערך הנתונים והתבוננו ב-5 השורות הראשונות של הנתונים.
+
+```r
+birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
+head(birds)
+```
+הנתונים כוללים תערובת של טקסט ומספרים:
+
+| | שם | שם מדעי | קטגוריה | סדר | משפחה | סוג | מצב שימור | אורך מינימלי | אורך מקסימלי | מסה מינימלית | מסה מקסימלית | מוטת כנפיים מינימלית | מוטת כנפיים מקסימלית |
+| ---: | :-------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :---------------- | ------------: | ------------: | ------------: | ------------: | --------------------: | --------------------: |
+| 0 | ברווז שורק שחור-בטן | Dendrocygna autumnalis | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
+| 1 | ברווז שורק חום | Dendrocygna bicolor | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
+| 2 | אווז שלג | Anser caerulescens | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
+| 3 | אווז רוס | Anser rossii | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
+| 4 | אווז לבן-מצח גדול | Anser albifrons | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
+
+נתחיל בשרטוט נתונים מספריים באמצעות גרף קווי בסיסי. נניח שברצונכם לראות את מוטת הכנפיים המקסימלית של הציפורים המעניינות הללו.
+
+```r
+install.packages("ggplot2")
+library("ggplot2")
+ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
+ geom_line()
+```
+כאן, אתם מתקינים את חבילת `ggplot2` ואז מייבאים אותה לסביבת העבודה באמצעות הפקודה `library("ggplot2")`. כדי לשרטט כל גרף ב-ggplot, משתמשים בפונקציה `ggplot()` ומציינים את מערך הנתונים, משתני x ו-y כמאפיינים. במקרה זה, אנו משתמשים בפונקציה `geom_line()` מכיוון שאנו מכוונים לשרטט גרף קווי.
+
+
+
+מה אתם מבחינים מיד? נראה שיש לפחות ערך חריג אחד - זו מוטת כנפיים מרשימה! מוטת כנפיים של יותר מ-2000 ס"מ שווה ליותר מ-20 מטרים - האם יש פטרודקטילים במינסוטה? בואו נחקור.
+
+בעוד שתוכלו לבצע מיון מהיר ב-Excel כדי למצוא את הערכים החריגים, שהם כנראה טעויות הקלדה, המשיכו בתהליך הוויזואליזציה מתוך הגרף.
+
+הוסיפו תוויות לציר ה-x כדי להראות אילו סוגי ציפורים מדובר:
+
+```r
+ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
+ geom_line() +
+ theme(axis.text.x = element_text(angle = 45, hjust=1))+
+ xlab("Birds") +
+ ylab("Wingspan (CM)") +
+ ggtitle("Max Wingspan in Centimeters")
+```
+אנו מציינים את הזווית ב-`theme` ומציינים את התוויות של צירי x ו-y ב-`xlab()` ו-`ylab()` בהתאמה. הפונקציה `ggtitle()` נותנת שם לגרף/תרשים.
+
+
+
+גם עם סיבוב התוויות ל-45 מעלות, יש יותר מדי תוויות לקריאה. בואו ננסה אסטרטגיה שונה: תייגו רק את הערכים החריגים והציבו את התוויות בתוך הגרף. תוכלו להשתמש בגרף פיזור כדי לפנות יותר מקום לתיוג:
+
+```r
+ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
+ geom_point() +
+ geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
+ theme(axis.title.x=element_blank(), axis.text.x=element_blank(), axis.ticks.x=element_blank())
+ ylab("Wingspan (CM)") +
+ ggtitle("Max Wingspan in Centimeters") +
+```
+מה קורה כאן? השתמשתם בפונקציה `geom_point()` כדי לשרטט נקודות פיזור. עם זאת, הוספתם תוויות לציפורים שמוטת הכנפיים המקסימלית שלהן `MaxWingspan > 500` וגם הסתרתם את התוויות על ציר x כדי להפחית עומס בגרף.
+
+מה אתם מגלים?
+
+
+
+## סינון הנתונים
+
+גם העיט הקירח וגם הבז הערבתי, למרות שהם כנראה ציפורים גדולות מאוד, נראים כמתויגים באופן שגוי, עם תוספת של 0 למוטת הכנפיים המקסימלית שלהם. לא סביר שתפגשו עיט קירח עם מוטת כנפיים של 25 מטרים, אבל אם כן, אנא עדכנו אותנו! בואו ניצור מערך נתונים חדש ללא שני הערכים החריגים הללו:
+
+```r
+birds_filtered <- subset(birds, MaxWingspan < 500)
+
+ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
+ geom_point() +
+ ylab("Wingspan (CM)") +
+ xlab("Birds") +
+ ggtitle("Max Wingspan in Centimeters") +
+ geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
+ theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())
+```
+יצרנו מערך נתונים חדש `birds_filtered` ואז שרטטנו גרף פיזור. על ידי סינון הערכים החריגים, הנתונים שלכם כעת יותר קוהרנטיים ומובנים.
+
+
+
+כעת, כשיש לנו מערך נתונים נקי יותר לפחות מבחינת מוטת כנפיים, בואו נגלה עוד על הציפורים הללו.
+
+בעוד שגרפים קוויים וגרפי פיזור יכולים להציג מידע על ערכי נתונים וההתפלגות שלהם, אנו רוצים לחשוב על הערכים הטמונים במערך הנתונים הזה. תוכלו ליצור ויזואליזציות כדי לענות על השאלות הבאות על כמויות:
+
+> כמה קטגוריות של ציפורים יש, ומה המספרים שלהן?
+> כמה ציפורים נכחדו, בסכנת הכחדה, נדירות או נפוצות?
+> כמה יש מכל סוג וסדר במינוח של לינאוס?
+## חקר גרפי עמודות
+
+גרפי עמודות הם פרקטיים כאשר יש צורך להציג קבוצות של נתונים. בואו נחקור את קטגוריות הציפורים הקיימות במערך הנתונים הזה כדי לראות איזו קטגוריה היא הנפוצה ביותר לפי מספר.
+ניצור גרף עמודות על נתונים מסוננים.
+
+```r
+install.packages("dplyr")
+install.packages("tidyverse")
+
+library(lubridate)
+library(scales)
+library(dplyr)
+library(ggplot2)
+library(tidyverse)
+
+birds_filtered %>% group_by(Category) %>%
+ summarise(n=n(),
+ MinLength = mean(MinLength),
+ MaxLength = mean(MaxLength),
+ MinBodyMass = mean(MinBodyMass),
+ MaxBodyMass = mean(MaxBodyMass),
+ MinWingspan=mean(MinWingspan),
+ MaxWingspan=mean(MaxWingspan)) %>%
+ gather("key", "value", - c(Category, n)) %>%
+ ggplot(aes(x = Category, y = value, group = key, fill = key)) +
+ geom_bar(stat = "identity") +
+ scale_fill_manual(values = c("#D62728", "#FF7F0E", "#8C564B","#2CA02C", "#1F77B4", "#9467BD")) +
+ xlab("Category")+ggtitle("Birds of Minnesota")
+
+```
+בקטע הבא, אנו מתקינים את החבילות [dplyr](https://www.rdocumentation.org/packages/dplyr/versions/0.7.8) ו-[lubridate](https://www.rdocumentation.org/packages/lubridate/versions/1.8.0) כדי לעזור במניפולציה וקיבוץ נתונים לצורך שרטוט גרף עמודות מוערם. תחילה, מקבצים את הנתונים לפי `Category` של הציפור ואז מסכמים את העמודות `MinLength`, `MaxLength`, `MinBodyMass`, `MaxBodyMass`, `MinWingspan`, `MaxWingspan`. לאחר מכן, שרטטו את גרף העמודות באמצעות חבילת `ggplot2` וציינו את הצבעים עבור הקטגוריות השונות והתוויות.
+
+
+
+גרף העמודות הזה, עם זאת, אינו קריא מכיוון שיש יותר מדי נתונים לא מקובצים. יש לבחור רק את הנתונים שברצונכם לשרטט, אז בואו נסתכל על אורך הציפורים לפי הקטגוריה שלהן.
+
+סננו את הנתונים כך שיכללו רק את קטגוריית הציפורים.
+
+מכיוון שיש קטגוריות רבות, תוכלו להציג את הגרף הזה בצורה אנכית ולהתאים את גובהו כך שיכלול את כל הנתונים:
+
+```r
+birds_count<-dplyr::count(birds_filtered, Category, sort = TRUE)
+birds_count$Category <- factor(birds_count$Category, levels = birds_count$Category)
+ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()
+```
+תחילה סופרים ערכים ייחודיים בעמודת `Category` ואז ממיינים אותם למערך נתונים חדש `birds_count`. נתונים ממיונים אלו מתועלים באותה רמה כך שהם משורטטים בסדר המיועד. באמצעות `ggplot2` אתם שרטטתם את הנתונים בגרף עמודות. הפונקציה `coord_flip()` מציגה עמודות אופקיות.
+
+
+
+גרף העמודות הזה מציג מבט טוב על מספר הציפורים בכל קטגוריה. במבט חטוף, ניתן לראות שמספר הציפורים הגדול ביותר באזור זה שייך לקטגוריית ברווזים/אווזים/עופות מים. מינסוטה היא "ארץ 10,000 האגמים", כך שזה לא מפתיע!
+
+✅ נסו לספור נתונים אחרים במערך הנתונים הזה. האם משהו מפתיע אתכם?
+
+## השוואת נתונים
+
+תוכלו לנסות השוואות שונות של נתונים מקובצים על ידי יצירת צירים חדשים. נסו השוואה של האורך המקסימלי של ציפור, בהתבסס על הקטגוריה שלה:
+
+```r
+birds_grouped <- birds_filtered %>%
+ group_by(Category) %>%
+ summarise(
+ MaxLength = max(MaxLength, na.rm = T),
+ MinLength = max(MinLength, na.rm = T)
+ ) %>%
+ arrange(Category)
+
+ggplot(birds_grouped,aes(Category,MaxLength))+geom_bar(stat="identity")+coord_flip()
+```
+אנו מקבצים את הנתונים המסוננים `birds_filtered` לפי `Category` ואז שרטטנו גרף עמודות.
+
+
+
+אין כאן הפתעות: לקוליברי יש את האורך המקסימלי הקטן ביותר בהשוואה לפליקנים או אווזים. זה טוב כאשר הנתונים הגיוניים מבחינה לוגית!
+
+תוכלו ליצור ויזואליזציות מעניינות יותר של גרפי עמודות על ידי חפיפת נתונים. בואו נחפוף את האורך המינימלי והמקסימלי על קטגוריית ציפור נתונה:
+
+```r
+ggplot(data=birds_grouped, aes(x=Category)) +
+ geom_bar(aes(y=MaxLength), stat="identity", position ="identity", fill='blue') +
+ geom_bar(aes(y=MinLength), stat="identity", position="identity", fill='orange')+
+ coord_flip()
+```
+
+
+## 🚀 אתגר
+
+מערך הנתונים הזה על ציפורים מציע שפע של מידע על סוגים שונים של ציפורים בתוך מערכת אקולוגית מסוימת. חפשו באינטרנט ונסו למצוא מערכי נתונים נוספים על ציפורים. תרגלו יצירת גרפים ותרשימים סביב הציפורים הללו כדי לגלות עובדות שלא ידעתם.
+
+## [שאלון לאחר השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/17)
+
+## סקירה ולימוד עצמי
+
+השיעור הראשון הזה נתן לכם מידע על איך להשתמש ב-`ggplot2` לויזואליזציה של כמויות. בצעו מחקר על דרכים נוספות לעבודה עם מערכי נתונים לויזואליזציה. חפשו מערכי נתונים שתוכלו לויזואליזציה באמצעות חבילות אחרות כמו [Lattice](https://stat.ethz.ch/R-manual/R-devel/library/lattice/html/Lattice.html) ו-[Plotly](https://github.com/plotly/plotly.R#readme).
+
+## משימה
+[קווים, פיזורים ועמודות](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו אחראים לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/R/09-visualization-quantities/assignment.md b/translations/he/3-Data-Visualization/R/09-visualization-quantities/assignment.md
new file mode 100644
index 00000000..9f269ce7
--- /dev/null
+++ b/translations/he/3-Data-Visualization/R/09-visualization-quantities/assignment.md
@@ -0,0 +1,25 @@
+
+# קווים, פיזורים ועמודות
+
+## הוראות
+
+בשיעור זה עבדתם עם גרפים של קווים, גרפים פיזוריים וגרפים עמודתיים כדי להציג עובדות מעניינות על מערך הנתונים הזה. במשימה זו, העמיקו במערך הנתונים כדי לגלות עובדה על סוג מסוים של ציפור. לדוגמה, צרו סקריפט שממחיש את כל הנתונים המעניינים שתוכלו לחשוף על אווזי השלג. השתמשו בשלושת הגרפים שהוזכרו לעיל כדי לספר סיפור במחברת שלכם.
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | --- |
+מוצג סקריפט עם הערות טובות, סיפוריות חזקה וגרפים מושכים | הסקריפט חסר אחד מהאלמנטים הללו | הסקריפט חסר שניים מהאלמנטים הללו
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לאי-הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/R/10-visualization-distributions/README.md b/translations/he/3-Data-Visualization/R/10-visualization-distributions/README.md
new file mode 100644
index 00000000..d88cd792
--- /dev/null
+++ b/translations/he/3-Data-Visualization/R/10-visualization-distributions/README.md
@@ -0,0 +1,183 @@
+
+# ויזואליזציה של התפלגויות
+
+| ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/10-Visualizing-Distributions.png)|
+|:---:|
+| ויזואליזציה של התפלגויות - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+בשיעור הקודם, למדתם כמה עובדות מעניינות על מערך נתונים של ציפורים ממינסוטה. מצאתם נתונים שגויים על ידי ויזואליזציה של ערכים חריגים ובחנתם את ההבדלים בין קטגוריות הציפורים לפי אורך מקסימלי.
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18)
+## חקר מערך הנתונים של הציפורים
+
+דרך נוספת לחקור נתונים היא על ידי בחינת ההתפלגות שלהם, כלומר איך הנתונים מאורגנים לאורך ציר. אולי, לדוגמה, תרצו ללמוד על ההתפלגות הכללית, עבור מערך הנתונים הזה, של מוטת כנפיים מקסימלית או מסת גוף מקסימלית של ציפורי מינסוטה.
+
+בואו נגלה כמה עובדות על ההתפלגויות של הנתונים במערך הנתונים הזה. בקונסולת R שלכם, ייבאו את `ggplot2` ואת מסד הנתונים. הסירו את הערכים החריגים ממסד הנתונים בדיוק כמו שעשיתם בנושא הקודם.
+
+```r
+library(ggplot2)
+
+birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
+
+birds_filtered <- subset(birds, MaxWingspan < 500)
+head(birds_filtered)
+```
+| | שם | שם מדעי | קטגוריה | סדר | משפחה | סוג | מצב שימור | אורך מינימלי | אורך מקסימלי | מסת גוף מינימלית | מסת גוף מקסימלית | מוטת כנפיים מינימלית | מוטת כנפיים מקסימלית |
+| ---: | :-------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | ----------: | ----------: | ----------: | ----------: |
+| 0 | ברווז שרוק שחור-בטן | Dendrocygna autumnalis | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
+| 1 | ברווז שרוק חלוד | Dendrocygna bicolor | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
+| 2 | אווז שלג | Anser caerulescens | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
+| 3 | אווז רוס | Anser rossii | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
+| 4 | אווז לבן-חזית גדול | Anser albifrons | ברווזים/אווזים/עופות מים | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
+
+באופן כללי, ניתן להסתכל במהירות על אופן ההתפלגות של הנתונים באמצעות תרשים פיזור כפי שעשינו בשיעור הקודם:
+
+```r
+ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
+ geom_point() +
+ ggtitle("Max Length per order") + coord_flip()
+```
+
+
+זה נותן סקירה כללית של ההתפלגות הכללית של אורך גוף לפי סדר הציפורים, אך זו אינה הדרך האופטימלית להציג התפלגויות אמיתיות. משימה זו בדרך כלל מתבצעת על ידי יצירת היסטוגרמה.
+## עבודה עם היסטוגרמות
+
+`ggplot2` מציע דרכים מצוינות לויזואליזציה של התפלגות נתונים באמצעות היסטוגרמות. סוג תרשים זה דומה לתרשים עמודות שבו ההתפלגות נראית דרך עלייה וירידה של העמודות. כדי לבנות היסטוגרמה, אתם צריכים נתונים מספריים. כדי לבנות היסטוגרמה, ניתן ליצור תרשים ולהגדיר את הסוג כ-'hist' עבור היסטוגרמה. תרשים זה מציג את ההתפלגות של MaxBodyMass עבור טווח הנתונים המספריים של מערך הנתונים כולו. על ידי חלוקת מערך הנתונים למקטעים קטנים יותר, ניתן להציג את ההתפלגות של ערכי הנתונים:
+
+```r
+ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
+ geom_histogram(bins=10)+ylab('Frequency')
+```
+
+
+כפי שניתן לראות, רוב 400+ הציפורים במערך הנתונים הזה נמצאות בטווח של מתחת ל-2000 עבור מסת הגוף המקסימלית שלהן. ניתן לקבל תובנות נוספות על הנתונים על ידי שינוי הפרמטר `bins` למספר גבוה יותר, כמו 30:
+
+```r
+ggplot(data = birds_filtered, aes(x = MaxBodyMass)) + geom_histogram(bins=30)+ylab('Frequency')
+```
+
+
+
+תרשים זה מציג את ההתפלגות בצורה מעט יותר מפורטת. ניתן ליצור תרשים פחות מוטה שמאלה על ידי הבטחת בחירת נתונים רק בטווח נתון:
+
+סננו את הנתונים כך שתקבלו רק את הציפורים שמסת הגוף שלהן מתחת ל-60, והציגו 30 `bins`:
+
+```r
+birds_filtered_1 <- subset(birds_filtered, MaxBodyMass > 1 & MaxBodyMass < 60)
+ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
+ geom_histogram(bins=30)+ylab('Frequency')
+```
+
+
+
+✅ נסו מסננים ונקודות נתונים אחרות. כדי לראות את ההתפלגות המלאה של הנתונים, הסירו את המסנן `['MaxBodyMass']` כדי להציג התפלגויות עם תוויות.
+
+ההיסטוגרמה מציעה גם שיפורים בצבע ובתוויות שכדאי לנסות:
+
+צרו היסטוגרמה דו-ממדית כדי להשוות את הקשר בין שתי התפלגויות. בואו נשווה בין `MaxBodyMass` ל-`MaxLength`. `ggplot2` מציע דרך מובנית להציג התכנסות באמצעות צבעים בהירים יותר:
+
+```r
+ggplot(data=birds_filtered_1, aes(x=MaxBodyMass, y=MaxLength) ) +
+ geom_bin2d() +scale_fill_continuous(type = "viridis")
+```
+נראה שיש מתאם צפוי בין שני האלמנטים הללו לאורך ציר צפוי, עם נקודת התכנסות חזקה במיוחד אחת:
+
+
+
+היסטוגרמות עובדות היטב כברירת מחדל עבור נתונים מספריים. מה אם אתם צריכים לראות התפלגויות לפי נתונים טקסטואליים?
+## חקר מערך הנתונים להתפלגויות באמצעות נתונים טקסטואליים
+
+מערך הנתונים הזה כולל גם מידע טוב על קטגוריית הציפורים, סוגן, מינן ומשפחתן, כמו גם על מצב השימור שלהן. בואו נחקור את המידע על מצב השימור. מהי ההתפלגות של הציפורים לפי מצב השימור שלהן?
+
+> ✅ במערך הנתונים, נעשה שימוש בכמה ראשי תיבות לתיאור מצב השימור. ראשי תיבות אלו מגיעים מ-[קטגוריות הרשימה האדומה של IUCN](https://www.iucnredlist.org/), ארגון שמקטלג את מצבם של מינים.
+>
+> - CR: בסכנת הכחדה חמורה
+> - EN: בסכנת הכחדה
+> - EX: נכחד
+> - LC: ללא חשש
+> - NT: קרוב לסיכון
+> - VU: פגיע
+
+אלו ערכים מבוססי טקסט ולכן תצטרכו לבצע טרנספורמציה כדי ליצור היסטוגרמה. באמצעות מסגרת הנתונים filteredBirds, הציגו את מצב השימור שלה לצד מוטת הכנפיים המינימלית שלה. מה אתם רואים?
+
+```r
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EX'] <- 'x1'
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'CR'] <- 'x2'
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EN'] <- 'x3'
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'NT'] <- 'x4'
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'VU'] <- 'x5'
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'LC'] <- 'x6'
+
+ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
+ geom_histogram(position = "identity", alpha = 0.4, bins = 20) +
+ scale_fill_manual(name="Conservation Status",values=c("red","green","blue","pink"),labels=c("Endangered","Near Threathened","Vulnerable","Least Concern"))
+```
+
+
+
+נראה שאין מתאם טוב בין מוטת כנפיים מינימלית למצב השימור. בדקו אלמנטים אחרים במערך הנתונים באמצעות שיטה זו. תוכלו לנסות מסננים שונים גם כן. האם אתם מוצאים מתאם כלשהו?
+
+## תרשימי צפיפות
+
+ייתכן ששמתם לב שההיסטוגרמות שראינו עד כה הן 'מדורגות' ואינן זורמות בצורה חלקה בקשת. כדי להציג תרשים צפיפות חלק יותר, תוכלו לנסות תרשים צפיפות.
+
+בואו נעבוד עכשיו עם תרשימי צפיפות!
+
+```r
+ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
+ geom_density()
+```
+
+
+ניתן לראות כיצד התרשים משקף את התרשים הקודם עבור נתוני מוטת כנפיים מינימלית; הוא פשוט מעט חלק יותר. אם תרצו לחזור לקו המדרגות של MaxBodyMass בתרשים השני שבניתם, תוכלו להחליק אותו היטב על ידי יצירתו מחדש באמצעות שיטה זו:
+
+```r
+ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
+ geom_density()
+```
+
+
+אם תרצו קו חלק, אך לא חלק מדי, ערכו את הפרמטר `adjust`:
+
+```r
+ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
+ geom_density(adjust = 1/5)
+```
+
+
+✅ קראו על הפרמטרים הזמינים עבור סוג תרשים זה ונסו להתנסות!
+
+סוג תרשים זה מציע ויזואליזציות מסבירות בצורה יפה. עם כמה שורות קוד, לדוגמה, תוכלו להציג את צפיפות מסת הגוף המקסימלית לפי סדר הציפורים:
+
+```r
+ggplot(data=birds_filtered_1,aes(x = MaxBodyMass, fill = Order)) +
+ geom_density(alpha=0.5)
+```
+
+
+## 🚀 אתגר
+
+היסטוגרמות הן סוג תרשים מתוחכם יותר מאשר תרשימי פיזור בסיסיים, תרשימי עמודות או תרשימי קו. חפשו באינטרנט דוגמאות טובות לשימוש בהיסטוגרמות. כיצד הן משמשות, מה הן מדגימות, ובאילו תחומים או תחומי מחקר הן נוטות להיות בשימוש?
+
+## [שאלון לאחר השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/19)
+
+## סקירה ולימוד עצמי
+
+בשיעור זה, השתמשתם ב-`ggplot2` והתחלתם לעבוד על הצגת תרשימים מתוחכמים יותר. בצעו מחקר על `geom_density_2d()` "עקומת צפיפות הסתברות רציפה בממד אחד או יותר". קראו את [התיעוד](https://ggplot2.tidyverse.org/reference/geom_density_2d.html) כדי להבין כיצד זה עובד.
+
+## משימה
+
+[יישמו את הכישורים שלכם](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/R/10-visualization-distributions/assignment.md b/translations/he/3-Data-Visualization/R/10-visualization-distributions/assignment.md
new file mode 100644
index 00000000..392dcdc7
--- /dev/null
+++ b/translations/he/3-Data-Visualization/R/10-visualization-distributions/assignment.md
@@ -0,0 +1,25 @@
+
+# יישום הכישורים שלך
+
+## הוראות
+
+עד כה עבדת עם מערך הנתונים של ציפורי מינסוטה כדי לגלות מידע על כמויות ציפורים וצפיפות אוכלוסייה. תרגל את יישום הטכניקות הללו על ידי ניסיון עם מערך נתונים אחר, אולי ממקור כמו [Kaggle](https://www.kaggle.com/). כתוב סקריפט ב-R שיספר סיפור על מערך הנתונים הזה, וודא שאתה משתמש בהיסטוגרמות כאשר אתה דן בו.
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | --- |
+מוצג סקריפט עם הערות על מערך הנתונים, כולל מקורו, ומשתמש בלפחות 5 היסטוגרמות כדי לגלות עובדות על הנתונים. | מוצג סקריפט עם הערות חלקיות או באגים. | מוצג סקריפט ללא הערות וכולל באגים.
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/R/11-visualization-proportions/README.md b/translations/he/3-Data-Visualization/R/11-visualization-proportions/README.md
new file mode 100644
index 00000000..6b48aadd
--- /dev/null
+++ b/translations/he/3-Data-Visualization/R/11-visualization-proportions/README.md
@@ -0,0 +1,196 @@
+
+# חזות יחסית
+
+| ](../../../sketchnotes/11-Visualizing-Proportions.png)|
+|:---:|
+|חזות יחסית - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+בשיעור זה, תשתמשו במאגר נתונים ממוקד טבע כדי להמחיש יחסים, כמו כמה סוגים שונים של פטריות מאכלסים מאגר נתונים מסוים על פטריות. בואו נחקור את הפטריות המרתקות הללו באמצעות מאגר נתונים שמקורו באודובון, המכיל פרטים על 23 מינים של פטריות עם זימים ממשפחות Agaricus ו-Lepiota. תתנסו בהמחשות טעימות כמו:
+
+- גרפים עוגה 🥧
+- גרפים דונאט 🍩
+- גרפים וופל 🧇
+
+> 💡 פרויקט מאוד מעניין בשם [Charticulator](https://charticulator.com) מבית Microsoft Research מציע ממשק גרירה ושחרור חינמי להמחשות נתונים. באחד מהשיעורים שלהם הם גם משתמשים במאגר הנתונים הזה של פטריות! כך תוכלו לחקור את הנתונים וללמוד את הספרייה בו זמנית: [שיעור Charticulator](https://charticulator.com/tutorials/tutorial4.html).
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20)
+
+## הכירו את הפטריות שלכם 🍄
+
+פטריות הן מאוד מעניינות. בואו נייבא מאגר נתונים כדי ללמוד עליהן:
+
+```r
+mushrooms = read.csv('../../data/mushrooms.csv')
+head(mushrooms)
+```
+טבלה מודפסת עם נתונים נהדרים לניתוח:
+
+| class | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | stalk-root | stalk-surface-above-ring | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
+| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
+| רעילה | קמורה | חלקה | חומה | חבורות | חריפה | חופשית | צפופה | צרה | שחורה | מתרחבת | שווה | חלקה | חלקה | לבנה | לבנה | חלקית | לבנה | אחת | תלויה | שחורה | מפוזרת | עירונית |
+| אכילה | קמורה | חלקה | צהובה | חבורות | שקדים | חופשית | צפופה | רחבה | שחורה | מתרחבת | מועדון | חלקה | חלקה | לבנה | לבנה | חלקית | לבנה | אחת | תלויה | חומה | מרובה | עשב |
+| אכילה | פעמונית | חלקה | לבנה | חבורות | אניס | חופשית | צפופה | רחבה | חומה | מתרחבת | מועדון | חלקה | חלקה | לבנה | לבנה | חלקית | לבנה | אחת | תלויה | חומה | מרובה | אחו |
+| רעילה | קמורה | קשקשית | לבנה | חבורות | חריפה | חופשית | צפופה | צרה | חומה | מתרחבת | שווה | חלקה | חלקה | לבנה | לבנה | חלקית | לבנה | אחת | תלויה | שחורה | מפוזרת | עירונית |
+| אכילה | קמורה | חלקה | ירוקה | ללא חבורות | ללא | חופשית | צפופה | רחבה | שחורה | מתחדדת | שווה | חלקה | חלקה | לבנה | לבנה | חלקית | לבנה | אחת | נעלמת | חומה | שופעת | עשב |
+| אכילה | קמורה | קשקשית | צהובה | חבורות | שקדים | חופשית | צפופה | רחבה | חומה | מתרחבת | מועדון | חלקה | חלקה | לבנה | לבנה | חלקית | לבנה | אחת | תלויה | שחורה | מרובה | עשב |
+
+מיד שמים לב שכל הנתונים הם טקסטואליים. תצטרכו להמיר את הנתונים כדי שתוכלו להשתמש בהם בגרף. למעשה, רוב הנתונים מיוצגים כאובייקט:
+
+```r
+names(mushrooms)
+```
+
+הפלט הוא:
+
+```output
+[1] "class" "cap.shape"
+ [3] "cap.surface" "cap.color"
+ [5] "bruises" "odor"
+ [7] "gill.attachment" "gill.spacing"
+ [9] "gill.size" "gill.color"
+[11] "stalk.shape" "stalk.root"
+[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
+[15] "stalk.color.above.ring" "stalk.color.below.ring"
+[17] "veil.type" "veil.color"
+[19] "ring.number" "ring.type"
+[21] "spore.print.color" "population"
+[23] "habitat"
+```
+קחו את הנתונים הללו והמירו את העמודה 'class' לקטגוריה:
+
+```r
+library(dplyr)
+grouped=mushrooms %>%
+ group_by(class) %>%
+ summarise(count=n())
+```
+
+עכשיו, אם תדפיסו את נתוני הפטריות, תוכלו לראות שהם חולקו לקטגוריות לפי מחלקת רעילות/אכילה:
+```r
+View(grouped)
+```
+
+| class | count |
+| --------- | --------- |
+| אכילה | 4208 |
+| רעילה | 3916 |
+
+אם תעקבו אחרי הסדר המוצג בטבלה זו כדי ליצור את תוויות הקטגוריה של המחלקה, תוכלו ליצור גרף עוגה.
+
+## עוגה!
+
+```r
+pie(grouped$count,grouped$class, main="Edible?")
+```
+והנה, גרף עוגה שמראה את היחסים של נתונים אלו לפי שתי מחלקות הפטריות. חשוב מאוד לקבל את סדר התוויות נכון, במיוחד כאן, אז ודאו את הסדר שבו נבנה מערך התוויות!
+
+
+
+## דונאט!
+
+גרף עוגה מעט יותר מעניין מבחינה חזותית הוא גרף דונאט, שהוא גרף עוגה עם חור באמצע. בואו נסתכל על הנתונים שלנו בשיטה זו.
+
+הסתכלו על בתי הגידול השונים שבהם פטריות גדלות:
+
+```r
+library(dplyr)
+habitat=mushrooms %>%
+ group_by(habitat) %>%
+ summarise(count=n())
+View(habitat)
+```
+הפלט הוא:
+| habitat| count |
+| --------- | --------- |
+| עשב | 2148 |
+| עלים | 832 |
+| אחו | 292 |
+| שבילים | 1144 |
+| עירונית | 368 |
+| פסולת | 192 |
+| עץ | 3148 |
+
+כאן, אתם מקבצים את הנתונים לפי בית גידול. ישנם 7 בתי גידול רשומים, אז השתמשו בהם כתוויות לגרף הדונאט שלכם:
+
+```r
+library(ggplot2)
+library(webr)
+PieDonut(habitat, aes(habitat, count=count))
+```
+
+
+
+הקוד הזה משתמש בשתי ספריות - ggplot2 ו-webr. באמצעות פונקציית PieDonut של ספריית webr, ניתן ליצור גרף דונאט בקלות!
+
+גרפי דונאט ב-R יכולים להיווצר גם באמצעות ספריית ggplot2 בלבד. תוכלו ללמוד עוד על כך [כאן](https://www.r-graph-gallery.com/128-ring-or-donut-plot.html) ולנסות זאת בעצמכם.
+
+עכשיו כשאתם יודעים איך לקבץ את הנתונים שלכם ואז להציג אותם כעוגה או דונאט, תוכלו לחקור סוגים אחרים של גרפים. נסו גרף וופל, שהוא פשוט דרך שונה לחקור כמויות.
+
+## וופלים!
+
+גרף מסוג 'וופל' הוא דרך שונה להמחיש כמויות כמערך דו-ממדי של ריבועים. נסו להמחיש את כמויות הצבעים של כובעי הפטריות במאגר הנתונים הזה. כדי לעשות זאת, תצטרכו להתקין ספריית עזר בשם [waffle](https://cran.r-project.org/web/packages/waffle/waffle.pdf) ולהשתמש בה ליצירת ההמחשה שלכם:
+
+```r
+install.packages("waffle", repos = "https://cinc.rud.is")
+```
+
+בחרו מקטע מהנתונים שלכם לקיבוץ:
+
+```r
+library(dplyr)
+cap_color=mushrooms %>%
+ group_by(cap.color) %>%
+ summarise(count=n())
+View(cap_color)
+```
+
+צרו גרף וופל על ידי יצירת תוויות ואז קיבוץ הנתונים שלכם:
+
+```r
+library(waffle)
+names(cap_color$count) = paste0(cap_color$cap.color)
+waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green",
+ "pink", "purple", "red", "grey",
+ "yellow","white"))
+```
+
+באמצעות גרף וופל, ניתן לראות בבירור את היחסים של צבעי כובעי הפטריות במאגר הנתונים הזה. מעניין, יש הרבה פטריות עם כובעים ירוקים!
+
+
+
+בשיעור זה, למדתם שלוש דרכים להמחשת יחסים. ראשית, עליכם לקבץ את הנתונים שלכם לקטגוריות ואז להחליט מהי הדרך הטובה ביותר להציג את הנתונים - עוגה, דונאט, או וופל. כולם טעימים ומספקים למשתמש תמונת מצב מיידית של מאגר נתונים.
+
+## 🚀 אתגר
+
+נסו ליצור מחדש את הגרפים הטעימים הללו ב-[Charticulator](https://charticulator.com).
+## [שאלון אחרי השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21)
+
+## סקירה ולימוד עצמי
+
+לפעמים לא ברור מתי להשתמש בעוגה, דונאט, או גרף וופל. הנה כמה מאמרים לקריאה בנושא:
+
+https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
+
+https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
+
+https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
+
+https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
+
+עשו מחקר כדי למצוא מידע נוסף על ההחלטה הדביקה הזו.
+## משימה
+
+[נסו זאת באקסל](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/R/12-visualization-relationships/README.md b/translations/he/3-Data-Visualization/R/12-visualization-relationships/README.md
new file mode 100644
index 00000000..2a729f51
--- /dev/null
+++ b/translations/he/3-Data-Visualization/R/12-visualization-relationships/README.md
@@ -0,0 +1,177 @@
+
+# חזות קשרים: הכל על דבש 🍯
+
+| ](../../../sketchnotes/12-Visualizing-Relationships.png)|
+|:---:|
+|חזות קשרים - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+בהמשך להתמקדות שלנו בטבע במחקר, בואו נגלה ויזואליזציות מעניינות שמציגות את הקשרים בין סוגי דבש שונים, לפי מאגר נתונים שמקורו ב-[משרד החקלאות של ארצות הברית](https://www.nass.usda.gov/About_NASS/index.php).
+
+מאגר הנתונים הזה, שמכיל כ-600 פריטים, מציג את ייצור הדבש במדינות רבות בארצות הברית. לדוגמה, ניתן לבחון את מספר הכוורות, התפוקה לכל כוורת, סך הייצור, המלאי, המחיר לקילוגרם, והערך של הדבש שיוצר במדינה מסוימת בין השנים 1998-2012, עם שורה אחת לכל שנה עבור כל מדינה.
+
+יהיה מעניין להציג את הקשר בין ייצור הדבש במדינה מסוימת בשנה נתונה לבין, למשל, המחיר של הדבש באותה מדינה. לחלופין, ניתן להציג את הקשר בין תפוקת הדבש לכל כוורת במדינות שונות. טווח השנים הזה כולל את התופעה ההרסנית 'CCD' או 'קריסת מושבות' שנצפתה לראשונה בשנת 2006 (http://npic.orst.edu/envir/ccd.html), ולכן זהו מאגר נתונים מרגש ללימוד. 🐝
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/22)
+
+בשיעור הזה, תוכלו להשתמש ב-ggplot2, ספרייה שכבר השתמשתם בה בעבר, כדי להציג קשרים בין משתנים. במיוחד מעניין השימוש בפונקציות `geom_point` ו-`qplot` של ggplot2, שמאפשרות ליצור תרשימי פיזור ותרשימי קו כדי להציג במהירות '[קשרים סטטיסטיים](https://ggplot2.tidyverse.org/)', שמסייעים למדען הנתונים להבין טוב יותר כיצד משתנים קשורים זה לזה.
+
+## תרשימי פיזור
+
+השתמשו בתרשים פיזור כדי להראות כיצד המחיר של דבש התפתח משנה לשנה, לפי מדינה. ggplot2, באמצעות `ggplot` ו-`geom_point`, מקבץ בנוחות את נתוני המדינות ומציג נקודות נתונים עבור נתונים קטגוריים ומספריים כאחד.
+
+נתחיל בייבוא הנתונים וב-Seaborn:
+
+```r
+honey=read.csv('../../data/honey.csv')
+head(honey)
+```
+שימו לב שהנתונים על הדבש כוללים כמה עמודות מעניינות, כולל שנה ומחיר לקילוגרם. בואו נחקור את הנתונים האלה, מקובצים לפי מדינות בארצות הברית:
+
+| מדינה | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
+| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
+| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
+| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
+| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
+| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
+| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
+| FL | 230000 | 98 |22540000 | 4508000 | 0.64 | 14426000 | 1998 |
+
+צרו תרשים פיזור בסיסי כדי להציג את הקשר בין המחיר לקילוגרם של דבש לבין מדינת המקור שלו. הפכו את ציר ה-`y` לגבוה מספיק כדי להציג את כל המדינות:
+
+```r
+library(ggplot2)
+ggplot(honey, aes(x = priceperlb, y = state)) +
+ geom_point(colour = "blue")
+```
+
+
+כעת, הציגו את אותם נתונים עם ערכת צבעים של דבש כדי להראות כיצד המחיר מתפתח לאורך השנים. ניתן לעשות זאת על ידי הוספת פרמטר 'scale_color_gradientn' כדי להציג את השינוי משנה לשנה:
+
+> ✅ למדו עוד על [scale_color_gradientn](https://www.rdocumentation.org/packages/ggplot2/versions/0.9.1/topics/scale_colour_gradientn) - נסו ערכת צבעים יפהפייה של קשת!
+
+```r
+ggplot(honey, aes(x = priceperlb, y = state, color=year)) +
+ geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7))
+```
+
+
+עם שינוי ערכת הצבעים, ניתן לראות בבירור התקדמות חזקה לאורך השנים מבחינת המחיר לקילוגרם של דבש. למעשה, אם תבחנו דוגמה מתוך הנתונים כדי לאמת (בחרו מדינה מסוימת, למשל אריזונה), תוכלו לראות דפוס של עליית מחירים משנה לשנה, עם מעט יוצאים מן הכלל:
+
+| מדינה | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | year |
+| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
+| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
+| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
+| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
+| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
+| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
+| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
+| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
+| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
+| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
+| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
+| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
+| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
+| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
+| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
+| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
+
+דרך נוספת להציג את ההתקדמות הזו היא באמצעות גודל, במקום צבע. עבור משתמשים עיוורי צבעים, זו עשויה להיות אפשרות טובה יותר. ערכו את הוויזואליזציה כך שתציג עלייה במחיר באמצעות עלייה בהיקף הנקודות:
+
+```r
+ggplot(honey, aes(x = priceperlb, y = state)) +
+ geom_point(aes(size = year),colour = "blue") +
+ scale_size_continuous(range = c(0.25, 3))
+```
+ניתן לראות שהגודל של הנקודות גדל בהדרגה.
+
+
+
+האם מדובר במקרה פשוט של היצע וביקוש? בשל גורמים כמו שינויי אקלים וקריסת מושבות, האם יש פחות דבש זמין לרכישה משנה לשנה, ולכן המחיר עולה?
+
+כדי לגלות קשר בין כמה מהמשתנים במאגר הנתונים הזה, בואו נחקור כמה תרשימי קו.
+
+## תרשימי קו
+
+שאלה: האם יש עלייה ברורה במחיר הדבש לקילוגרם משנה לשנה? ניתן לגלות זאת בקלות על ידי יצירת תרשים קו יחיד:
+
+```r
+qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab = "priceperlb")
+```
+תשובה: כן, עם כמה יוצאים מן הכלל סביב שנת 2003:
+
+
+
+שאלה: ובכן, בשנת 2003 האם ניתן לראות גם עלייה בהיצע הדבש? מה אם תבחנו את סך הייצור משנה לשנה?
+
+```python
+qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod")
+```
+
+
+
+תשובה: לא ממש. אם תבחנו את סך הייצור, נראה שהוא דווקא עלה בשנה הזו, למרות שבאופן כללי כמות הדבש שמיוצרת נמצאת בירידה במהלך השנים הללו.
+
+שאלה: במקרה כזה, מה יכול היה לגרום לעלייה במחיר הדבש סביב שנת 2003?
+
+כדי לגלות זאת, ניתן לחקור רשתות פיצול.
+
+## רשתות פיצול
+
+רשתות פיצול לוקחות היבט אחד ממאגר הנתונים שלכם (במקרה שלנו, ניתן לבחור 'שנה' כדי להימנע מיצירת יותר מדי פיצולים). Seaborn יכול אז ליצור תרשים עבור כל אחד מהפיצולים של הקואורדינטות שבחרתם עבור x ו-y להשוואה חזותית קלה יותר. האם שנת 2003 בולטת בהשוואה מסוג זה?
+
+צרו רשת פיצול באמצעות `facet_wrap` כפי שמומלץ בתיעוד של [ggplot2](https://ggplot2.tidyverse.org/reference/facet_wrap.html).
+
+```r
+ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) +
+ geom_line() + facet_wrap(vars(year))
+```
+בוויזואליזציה הזו, ניתן להשוות את התפוקה לכל כוורת ומספר הכוורות משנה לשנה, זו לצד זו עם פיצול שמוגדר ל-3 עבור העמודות:
+
+
+
+עבור מאגר הנתונים הזה, שום דבר לא בולט במיוחד בכל הנוגע למספר הכוורות והתפוקה שלהן, משנה לשנה ומדינה למדינה. האם יש דרך אחרת למצוא קשר בין שני המשתנים הללו?
+
+## תרשימי קו כפולים
+
+נסו תרשים קו מרובה על ידי הצבת שני תרשימי קו זה על גבי זה, באמצעות הפונקציות `par` ו-`plot` של R. נשרטט את השנה בציר ה-x ונציג שני צירי y. כלומר, נציג את התפוקה לכל כוורת ואת מספר הכוורות, זה על גבי זה:
+
+```r
+par(mar = c(5, 4, 4, 4) + 0.3)
+plot(honey$year, honey$numcol, pch = 16, col = 2,type="l")
+par(new = TRUE)
+plot(honey$year, honey$yieldpercol, pch = 17, col = 3,
+ axes = FALSE, xlab = "", ylab = "",type="l")
+axis(side = 4, at = pretty(range(y2)))
+mtext("colony yield", side = 4, line = 3)
+```
+
+
+למרות ששום דבר לא בולט לעין סביב שנת 2003, זה מאפשר לנו לסיים את השיעור הזה בנימה מעט שמחה יותר: למרות שיש ירידה כללית במספר הכוורות, מספר הכוורות מתייצב גם אם התפוקה שלהן לכל כוורת יורדת.
+
+קדימה, דבורים, קדימה!
+
+🐝❤️
+## 🚀 אתגר
+
+בשיעור הזה, למדתם קצת יותר על שימושים אחרים בתרשימי פיזור ורשתות קו, כולל רשתות פיצול. אתגרו את עצמכם ליצור רשת פיצול באמצעות מאגר נתונים אחר, אולי כזה שהשתמשתם בו לפני השיעורים הללו. שימו לב כמה זמן לוקח ליצור אותם וכיצד עליכם להיזהר בכמות הפיצולים שאתם צריכים לצייר באמצעות הטכניקות הללו.
+## [שאלון אחרי השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/23)
+
+## סקירה ולימוד עצמי
+
+תרשימי קו יכולים להיות פשוטים או מורכבים למדי. עשו קצת קריאה בתיעוד של [ggplot2](https://ggplot2.tidyverse.org/reference/geom_path.html#:~:text=geom_line()%20connects%20them%20in,which%20cases%20are%20connected%20together) על הדרכים השונות שבהן ניתן לבנות אותם. נסו לשפר את תרשימי הקו שבניתם בשיעור הזה עם שיטות אחרות שמופיעות בתיעוד.
+## משימה
+
+[צללו לתוך הכוורת](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/R/13-meaningful-vizualizations/README.md b/translations/he/3-Data-Visualization/R/13-meaningful-vizualizations/README.md
new file mode 100644
index 00000000..003f5dbc
--- /dev/null
+++ b/translations/he/3-Data-Visualization/R/13-meaningful-vizualizations/README.md
@@ -0,0 +1,182 @@
+
+# יצירת ויזואליזציות משמעותיות
+
+| ](../../../sketchnotes/13-MeaningfulViz.png)|
+|:---:|
+| ויזואליזציות משמעותיות - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+> "אם תענה את הנתונים מספיק זמן, הם יתוודו על כל דבר" -- [רונלד קואז](https://en.wikiquote.org/wiki/Ronald_Coase)
+
+אחת המיומנויות הבסיסיות של מדען נתונים היא היכולת ליצור ויזואליזציה משמעותית של נתונים שמסייעת לענות על שאלות שעולות. לפני שתתחיל ליצור ויזואליזציה של הנתונים שלך, עליך לוודא שהם נוקו והוכנו, כפי שעשית בשיעורים הקודמים. לאחר מכן, תוכל להתחיל להחליט כיצד להציג את הנתונים בצורה הטובה ביותר.
+
+בשיעור זה תסקור:
+
+1. כיצד לבחור את סוג התרשים הנכון
+2. כיצד להימנע מתרשימים מטעים
+3. כיצד לעבוד עם צבע
+4. כיצד לעצב את התרשימים שלך לקריאות טובה יותר
+5. כיצד ליצור פתרונות תרשימים מונפשים או תלת-ממדיים
+6. כיצד ליצור ויזואליזציה יצירתית
+
+## [מבחן מקדים לשיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/24)
+
+## בחירת סוג התרשים הנכון
+
+בשיעורים קודמים התנסית ביצירת כל מיני ויזואליזציות נתונים מעניינות באמצעות Matplotlib ו-Seaborn. באופן כללי, תוכל לבחור את [סוג התרשים הנכון](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) לשאלה שאתה שואל באמצעות הטבלה הבאה:
+
+| מה אתה צריך לעשות: | מה כדאי להשתמש: |
+| -------------------------- | ------------------------------- |
+| להציג מגמות נתונים לאורך זמן | קו |
+| להשוות קטגוריות | עמודות, עוגה |
+| להשוות סך הכל | עוגה, עמודות מוערמות |
+| להציג קשרים | פיזור, קו, פן, קו כפול |
+| להציג התפלגויות | פיזור, היסטוגרמה, קופסה |
+| להציג פרופורציות | עוגה, דונאט, וופל |
+
+> ✅ בהתאם להרכב הנתונים שלך, ייתכן שתצטרך להמיר אותם מטקסט למספרים כדי שתרשים מסוים יתמוך בהם.
+
+## הימנעות מהטעיה
+
+גם אם מדען נתונים מקפיד לבחור את התרשים הנכון לנתונים הנכונים, יש דרכים רבות שבהן ניתן להציג נתונים באופן שמוכיח נקודה, לעיתים על חשבון הנתונים עצמם. ישנם דוגמאות רבות לתרשימים ואינפוגרפיקות מטעים!
+
+[](https://www.youtube.com/watch?v=oX74Nge8Wkw "איך תרשימים משקרים")
+
+> 🎥 לחץ על התמונה למעלה להרצאה על תרשימים מטעים
+
+התרשים הזה הופך את ציר ה-X כדי להציג את ההפך מהאמת, בהתבסס על תאריך:
+
+
+
+[התרשים הזה](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) אפילו יותר מטעה, שכן העין נמשכת ימינה כדי להסיק שבמהלך הזמן, מקרי הקורונה ירדו במחוזות השונים. למעשה, אם תסתכל מקרוב על התאריכים, תמצא שהם סודרו מחדש כדי ליצור מגמת ירידה מטעה.
+
+
+
+הדוגמה הידועה הזו משתמשת בצבע ובציר Y הפוך כדי להטעות: במקום להסיק שמקרי המוות מנשק עלו לאחר חקיקת חוקים ידידותיים לנשק, למעשה העין מתעתעת לחשוב שההפך הוא הנכון:
+
+
+
+התרשים המוזר הזה מראה כיצד ניתן לתמרן פרופורציות, בצורה משעשעת:
+
+
+
+השוואת דברים שאינם ברי השוואה היא עוד טריק מפוקפק. ישנו [אתר נפלא](https://tylervigen.com/spurious-correlations) שמציג 'קורלציות שגויות' עם 'עובדות' שמקשרות בין דברים כמו שיעור הגירושין במיין לצריכת מרגרינה. קבוצת Reddit גם אוספת את [השימושים המכוערים](https://www.reddit.com/r/dataisugly/top/?t=all) בנתונים.
+
+חשוב להבין כמה קל להטעות את העין באמצעות תרשימים מטעים. גם אם כוונת מדען הנתונים טובה, בחירת סוג תרשים גרוע, כמו תרשים עוגה שמציג יותר מדי קטגוריות, יכולה להיות מטעה.
+
+## צבע
+
+ראית בתרשים 'אלימות נשק בפלורידה' כיצד צבע יכול להוסיף שכבה נוספת של משמעות לתרשימים, במיוחד כאלה שלא עוצבו באמצעות ספריות כמו ggplot2 ו-RColorBrewer שמגיעות עם ספריות צבע ופלטות מאושרות. אם אתה יוצר תרשים באופן ידני, למד מעט על [תורת הצבעים](https://colormatters.com/color-and-design/basic-color-theory)
+
+> ✅ היה מודע לכך שבעיצוב תרשימים, נגישות היא היבט חשוב של ויזואליזציה. חלק מהמשתמשים שלך עשויים להיות עיוורי צבעים - האם התרשים שלך מוצג היטב עבור משתמשים עם לקויות ראייה?
+
+היה זהיר בבחירת צבעים לתרשים שלך, שכן צבע יכול להעביר משמעות שאולי לא התכוונת אליה. ה'נשים הוורודות' בתרשים 'גובה' למעלה מעבירות משמעות נשית מובהקת שמוסיפה למוזרות של התרשים עצמו.
+
+בעוד ש[משמעות הצבעים](https://colormatters.com/color-symbolism/the-meanings-of-colors) עשויה להיות שונה בחלקים שונים של העולם, והיא נוטה להשתנות בהתאם לגוון שלה. באופן כללי, משמעויות הצבעים כוללות:
+
+| צבע | משמעות |
+| ------ | ------------------- |
+| אדום | כוח |
+| כחול | אמון, נאמנות |
+| צהוב | אושר, זהירות |
+| ירוק | אקולוגיה, מזל, קנאה |
+| סגול | אושר |
+| כתום | חיוניות |
+
+אם אתה מתבקש ליצור תרשים עם צבעים מותאמים אישית, ודא שהתרשימים שלך גם נגישים וגם שהצבע שבחרת תואם את המשמעות שאתה מנסה להעביר.
+
+## עיצוב התרשימים שלך לקריאות טובה
+
+תרשימים אינם משמעותיים אם הם אינם קריאים! הקדש רגע לשקול עיצוב רוחב וגובה התרשים שלך כך שיתאים היטב לנתונים שלך. אם משתנה אחד (כמו כל 50 המדינות) צריך להיות מוצג, הצג אותם אנכית על ציר ה-Y אם אפשר כדי להימנע מתרשים שדורש גלילה אופקית.
+
+תייג את הצירים שלך, ספק מקרא אם יש צורך, והצע טיפים לשיפור הבנת הנתונים.
+
+אם הנתונים שלך הם טקסטואליים ומפורטים בציר ה-X, תוכל להטות את הטקסט לקריאות טובה יותר. [plot3D](https://cran.r-project.org/web/packages/plot3D/index.html) מציע גרפים תלת-ממדיים, אם הנתונים שלך תומכים בכך. ניתן ליצור ויזואליזציות מתוחכמות באמצעותו.
+
+
+
+## אנימציה ותצוגת תרשימים תלת-ממדיים
+
+חלק מהויזואליזציות הטובות ביותר כיום הן מונפשות. שירלי וו יצרה ויזואליזציות מדהימות עם D3, כמו '[פרחי סרטים](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', שבה כל פרח הוא ויזואליזציה של סרט. דוגמה נוספת עבור ה-Guardian היא 'בוסס החוצה', חוויה אינטראקטיבית שמשלבת ויזואליזציות עם Greensock ו-D3 יחד עם פורמט מאמר סקרוליטלי כדי להראות כיצד ניו יורק מתמודדת עם בעיית חסרי הבית שלה על ידי שליחת אנשים מחוץ לעיר.
+
+
+
+> "בוסס החוצה: כיצד אמריקה מזיזה את חסרי הבית שלה" מתוך [הגרדיאן](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). ויזואליזציות מאת נדיה ברמר ושירלי וו
+
+בעוד שהשיעור הזה אינו מספיק כדי להיכנס לעומק וללמד את הספריות החזקות הללו לויזואליזציה, נסה את ידך ב-D3 באפליקציית Vue.js באמצעות ספרייה להצגת ויזואליזציה של הספר "יחסים מסוכנים" כרשת חברתית מונפשת.
+
+> "יחסים מסוכנים" הוא רומן אפיסטולרי, או רומן שמוצג כסדרה של מכתבים. נכתב בשנת 1782 על ידי שודרלו דה לאקלו, הוא מספר את סיפורם של המהלכים החברתיים המרושעים והמוסריים של שני גיבורים יריבים באריסטוקרטיה הצרפתית בסוף המאה ה-18, הוויקונט דה ואלמונט והמרקיזה דה מרטיי. שניהם מוצאים את סופם בסוף אך לא לפני שהם גורמים לנזק חברתי רב. הרומן מתפתח כסדרה של מכתבים שנכתבו לאנשים שונים במעגלים שלהם, מתכננים נקמה או פשוט כדי ליצור צרות. צור ויזואליזציה של המכתבים הללו כדי לגלות את הדמויות המרכזיות של הנרטיב, באופן חזותי.
+
+תשלים אפליקציית ווב שתציג תצוגה מונפשת של הרשת החברתית הזו. היא משתמשת בספרייה שנבנתה כדי ליצור [ויזואליזציה של רשת](https://github.com/emiliorizzo/vue-d3-network) באמצעות Vue.js ו-D3. כשהאפליקציה פועלת, תוכל להזיז את הצמתים על המסך כדי לשנות את סידור הנתונים.
+
+
+
+## פרויקט: צור תרשים להצגת רשת באמצעות D3.js
+
+> תיקיית השיעור כוללת תיקיית `solution` שבה תוכל למצוא את הפרויקט המושלם, לעיונך.
+
+1. עקוב אחר ההוראות בקובץ README.md בתיקיית השורש של תיקיית ההתחלה. ודא שיש לך NPM ו-Node.js פועלים במחשב שלך לפני התקנת התלויות של הפרויקט שלך.
+
+2. פתח את התיקייה `starter/src`. תגלה תיקיית `assets` שבה תוכל למצוא קובץ .json עם כל המכתבים מהרומן, ממוספרים, עם הערות 'אל' ו'מ'.
+
+3. השלם את הקוד ב-`components/Nodes.vue` כדי לאפשר את הויזואליזציה. חפש את השיטה שנקראת `createLinks()` והוסף את הלולאה המקוננת הבאה.
+
+לולאה דרך אובייקט ה-.json כדי ללכוד את נתוני 'אל' ו'מ' עבור המכתבים ולבנות את אובייקט `links` כך שספריית הויזואליזציה תוכל לצרוך אותו:
+
+```javascript
+//loop through letters
+ let f = 0;
+ let t = 0;
+ for (var i = 0; i < letters.length; i++) {
+ for (var j = 0; j < characters.length; j++) {
+
+ if (characters[j] == letters[i].from) {
+ f = j;
+ }
+ if (characters[j] == letters[i].to) {
+ t = j;
+ }
+ }
+ this.links.push({ sid: f, tid: t });
+ }
+ ```
+
+הרץ את האפליקציה שלך מהטרמינל (npm run serve) ותהנה מהויזואליזציה!
+
+## 🚀 אתגר
+
+צא לסיור באינטרנט כדי לגלות ויזואליזציות מטעים. כיצד המחבר מטעה את המשתמש, והאם זה מכוון? נסה לתקן את הויזואליזציות כדי להראות כיצד הן אמורות להיראות.
+
+## [מבחן מסכם לשיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/25)
+
+## סקירה ולימוד עצמי
+
+הנה כמה מאמרים לקריאה על ויזואליזציות נתונים מטעים:
+
+https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
+
+http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
+
+עיין בויזואליזציות מעניינות לנכסים והיסטוריה:
+
+https://handbook.pubpub.org/
+
+עיין במאמר זה על איך אנימציה יכולה לשפר את הויזואליזציות שלך:
+
+https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
+
+## משימה
+
+[צור ויזואליזציה מותאמת אישית משלך](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/3-Data-Visualization/README.md b/translations/he/3-Data-Visualization/README.md
new file mode 100644
index 00000000..bafd8691
--- /dev/null
+++ b/translations/he/3-Data-Visualization/README.md
@@ -0,0 +1,42 @@
+
+# ויזואליזציות
+
+
+> צילום על ידי Jenna Lee ב-Unsplash
+
+הדמיית נתונים היא אחת המשימות החשובות ביותר של מדען נתונים. תמונות שוות אלף מילים, וויזואליזציה יכולה לעזור לך לזהות כל מיני חלקים מעניינים בנתונים שלך כמו קפיצות, חריגות, קבוצות, מגמות ועוד, שיכולים לעזור לך להבין את הסיפור שהנתונים שלך מנסים לספר.
+
+בחמשת השיעורים הללו, תחקור נתונים שמקורם בטבע ותיצור ויזואליזציות מעניינות ויפות באמצעות טכניקות שונות.
+
+| מספר נושא | נושא | שיעור מקושר | מחבר |
+| :-----------: | :--: | :-----------: | :----: |
+| 1. | הדמיית כמויות | - [Python](09-visualization-quantities/README.md)
- [R](../../../3-Data-Visualization/R/09-visualization-quantities)
| - [Jen Looper](https://twitter.com/jenlooper)
- [Vidushi Gupta](https://github.com/Vidushi-Gupta)
- [Jasleen Sondhi](https://github.com/jasleen101010)
|
+| 2. | הדמיית התפלגות | - [Python](10-visualization-distributions/README.md)
- [R](../../../3-Data-Visualization/R/10-visualization-distributions)
| - [Jen Looper](https://twitter.com/jenlooper)
- [Vidushi Gupta](https://github.com/Vidushi-Gupta)
- [Jasleen Sondhi](https://github.com/jasleen101010)
|
+| 3. | הדמיית פרופורציות | - [Python](11-visualization-proportions/README.md)
- [R](../../../3-Data-Visualization)
| - [Jen Looper](https://twitter.com/jenlooper)
- [Vidushi Gupta](https://github.com/Vidushi-Gupta)
- [Jasleen Sondhi](https://github.com/jasleen101010)
|
+| 4. | הדמיית קשרים | - [Python](12-visualization-relationships/README.md)
- [R](../../../3-Data-Visualization)
| - [Jen Looper](https://twitter.com/jenlooper)
- [Vidushi Gupta](https://github.com/Vidushi-Gupta)
- [Jasleen Sondhi](https://github.com/jasleen101010)
|
+| 5. | יצירת ויזואליזציות משמעותיות | - [Python](13-meaningful-visualizations/README.md)
- [R](../../../3-Data-Visualization)
| - [Jen Looper](https://twitter.com/jenlooper)
- [Vidushi Gupta](https://github.com/Vidushi-Gupta)
- [Jasleen Sondhi](https://github.com/jasleen101010)
|
+
+### קרדיטים
+
+שיעורי הוויזואליזציה הללו נכתבו באהבה 🌸 על ידי [Jen Looper](https://twitter.com/jenlooper), [Jasleen Sondhi](https://github.com/jasleen101010) ו-[Vidushi Gupta](https://github.com/Vidushi-Gupta).
+
+🍯 נתונים על ייצור דבש בארה"ב נלקחו מפרויקט של Jessica Li ב-[Kaggle](https://www.kaggle.com/jessicali9530/honey-production). ה-[נתונים](https://usda.library.cornell.edu/concern/publications/rn301137d) נגזרו מ-[משרד החקלאות של ארצות הברית](https://www.nass.usda.gov/About_NASS/index.php).
+
+🍄 נתונים על פטריות נלקחו גם הם מ-[Kaggle](https://www.kaggle.com/hatterasdunton/mushroom-classification-updated-dataset) ונערכו על ידי Hatteras Dunton. מערך נתונים זה כולל תיאורים של דגימות היפותטיות המתאימות ל-23 מינים של פטריות ממשפחת Agaricus ו-Lepiota. פטריות נלקחו מהמדריך של אגודת Audubon לפטריות בצפון אמריקה (1981). מערך נתונים זה נתרם ל-UCI ML בשנת 1987.
+
+🦆 נתונים על ציפורים ממינסוטה נלקחו מ-[Kaggle](https://www.kaggle.com/hannahcollins/minnesota-birds) ונאספו מ-[ויקיפדיה](https://en.wikipedia.org/wiki/List_of_birds_of_Minnesota) על ידי Hannah Collins.
+
+כל מערכי הנתונים הללו מורשים תחת [CC0: Creative Commons](https://creativecommons.org/publicdomain/zero/1.0/).
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/4-Data-Science-Lifecycle/14-Introduction/README.md b/translations/he/4-Data-Science-Lifecycle/14-Introduction/README.md
new file mode 100644
index 00000000..7ded9a54
--- /dev/null
+++ b/translations/he/4-Data-Science-Lifecycle/14-Introduction/README.md
@@ -0,0 +1,120 @@
+
+# מבוא למחזור החיים של מדעי הנתונים
+
+| ](../../sketchnotes/14-DataScience-Lifecycle.png)|
+|:---:|
+| מבוא למחזור החיים של מדעי הנתונים - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+## [שאלון לפני השיעור](https://red-water-0103e7a0f.azurestaticapps.net/quiz/26)
+
+בשלב זה כנראה כבר הבנתם שמדעי הנתונים הם תהליך. תהליך זה ניתן לחלק לחמישה שלבים:
+
+- איסוף
+- עיבוד
+- ניתוח
+- תקשורת
+- תחזוקה
+
+השיעור הזה מתמקד בשלושה חלקים מתוך מחזור החיים: איסוף, עיבוד ותחזוקה.
+
+
+> תמונה מאת [Berkeley School of Information](https://ischoolonline.berkeley.edu/data-science/what-is-data-science/)
+
+## איסוף
+
+השלב הראשון במחזור החיים הוא קריטי, שכן השלבים הבאים תלויים בו. למעשה, מדובר בשני שלבים שמאוחדים לאחד: רכישת הנתונים והגדרת המטרה והבעיות שיש לטפל בהן.
+הגדרת מטרות הפרויקט תדרוש הבנה מעמיקה יותר של הבעיה או השאלה. ראשית, יש לזהות ולרכוש את מי שזקוקים לפתרון הבעיה שלהם. אלו יכולים להיות בעלי עניין בעסק או נותני חסות לפרויקט, שיכולים לעזור לזהות מי או מה ייהנה מהפרויקט הזה, כמו גם מה הם צריכים ולמה. מטרה מוגדרת היטב צריכה להיות מדידה וכמותית כדי להגדיר תוצאה מקובלת.
+
+שאלות שמדען נתונים עשוי לשאול:
+- האם הבעיה הזו נבחנה בעבר? מה התגלה?
+- האם המטרה והיעד מובנים לכל המעורבים?
+- האם יש עמימות וכיצד ניתן להפחית אותה?
+- מהם המגבלות?
+- איך תיראה התוצאה הסופית?
+- כמה משאבים (זמן, אנשים, חישוביים) זמינים?
+
+השלב הבא הוא זיהוי, איסוף ולבסוף חקר הנתונים הדרושים להשגת המטרות שהוגדרו. בשלב זה של רכישת הנתונים, מדעני נתונים חייבים גם להעריך את הכמות והאיכות של הנתונים. זה דורש חקר נתונים כדי לאשר שהנתונים שנאספו יתמכו בהשגת התוצאה הרצויה.
+
+שאלות שמדען נתונים עשוי לשאול על הנתונים:
+- אילו נתונים כבר זמינים לי?
+- מי הבעלים של הנתונים האלה?
+- מהם החששות לגבי פרטיות?
+- האם יש לי מספיק נתונים כדי לפתור את הבעיה?
+- האם הנתונים באיכות מספקת עבור הבעיה הזו?
+- אם אני מגלה מידע נוסף דרך הנתונים האלה, האם כדאי לשקול לשנות או להגדיר מחדש את המטרות?
+
+## עיבוד
+
+שלב העיבוד במחזור החיים מתמקד בגילוי דפוסים בנתונים ובבניית מודלים. חלק מהטכניקות בשלב העיבוד דורשות שיטות סטטיסטיות כדי לחשוף את הדפוסים. בדרך כלל, זו תהיה משימה מייגעת עבור אדם להתמודד עם מערך נתונים גדול, ולכן מסתמכים על מחשבים כדי להאיץ את התהליך. בשלב זה מדעי הנתונים ולמידת מכונה מצטלבים. כפי שלמדתם בשיעור הראשון, למידת מכונה היא תהליך של בניית מודלים להבנת הנתונים. מודלים הם ייצוג של הקשר בין משתנים בנתונים שמסייעים לחזות תוצאות.
+
+טכניקות נפוצות בשלב זה מכוסות בתוכנית הלימודים של ML למתחילים. עקבו אחר הקישורים כדי ללמוד עוד עליהן:
+
+- [סיווג](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification): ארגון נתונים לקטגוריות לשימוש יעיל יותר.
+- [אשכולות](https://github.com/microsoft/ML-For-Beginners/tree/main/5-Clustering): קיבוץ נתונים לקבוצות דומות.
+- [רגרסיה](https://github.com/microsoft/ML-For-Beginners/tree/main/2-Regression): קביעת הקשרים בין משתנים כדי לחזות או לצפות ערכים.
+
+## תחזוקה
+
+בתרשים של מחזור החיים, אולי שמתם לב שתחזוקה נמצאת בין איסוף לעיבוד. תחזוקה היא תהליך מתמשך של ניהול, אחסון ואבטחת הנתונים לאורך כל תהליך הפרויקט ויש לקחת אותה בחשבון לאורך כל הפרויקט.
+
+### אחסון נתונים
+שיקולים לגבי איך והיכן הנתונים מאוחסנים יכולים להשפיע על עלות האחסון כמו גם על ביצועי הגישה לנתונים. החלטות כאלה לא סביר שיתקבלו על ידי מדען נתונים בלבד, אך ייתכן שהוא יצטרך לבחור כיצד לעבוד עם הנתונים בהתאם לאופן שבו הם מאוחסנים.
+
+הנה כמה היבטים של מערכות אחסון נתונים מודרניות שיכולים להשפיע על הבחירות הללו:
+
+**במקום מול מחוץ למקום מול ענן ציבורי או פרטי**
+
+"במקום" מתייחס לאחסון וניהול הנתונים על ציוד בבעלותכם, כמו שרת עם כוננים קשיחים שמאחסנים את הנתונים, בעוד "מחוץ למקום" מסתמך על ציוד שאינו בבעלותכם, כמו מרכז נתונים. הענן הציבורי הוא בחירה פופולרית לאחסון נתונים שאינה דורשת ידע על איך או איפה בדיוק הנתונים מאוחסנים, כאשר "ציבורי" מתייחס לתשתית אחידה שמשותפת לכל מי שמשתמש בענן. חלק מהארגונים מחזיקים במדיניות אבטחה מחמירה שדורשת גישה מלאה לציוד שבו הנתונים מאוחסנים, ולכן הם מסתמכים על ענן פרטי שמספק שירותי ענן משלו. תלמדו עוד על נתונים בענן בשיעורים [מאוחרים יותר](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/5-Data-Science-In-Cloud).
+
+**נתונים "קרים" מול נתונים "חמים"**
+
+כאשר אתם מאמנים את המודלים שלכם, ייתכן שתזדקקו ליותר נתוני אימון. אם אתם מרוצים מהמודל שלכם, יגיעו נתונים נוספים כדי שהמודל יוכל לשרת את מטרתו. בכל מקרה, עלות אחסון וגישה לנתונים תגדל ככל שתצברו יותר מהם. הפרדת נתונים שנעשה בהם שימוש לעיתים רחוקות, המכונים נתונים "קרים", מנתונים שנעשה בהם שימוש תדיר, המכונים נתונים "חמים", יכולה להיות אפשרות אחסון נתונים זולה יותר באמצעות שירותי חומרה או תוכנה. אם יש צורך לגשת לנתונים "קרים", ייתכן שייקח מעט יותר זמן לשלוף אותם בהשוואה לנתונים "חמים".
+
+### ניהול נתונים
+במהלך העבודה עם נתונים, ייתכן שתגלו שחלק מהנתונים צריכים לעבור ניקוי באמצעות חלק מהטכניקות שנלמדו בשיעור על [הכנת נתונים](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/08-data-preparation) כדי לבנות מודלים מדויקים. כאשר מגיעים נתונים חדשים, יהיה צורך ליישם את אותן טכניקות כדי לשמור על עקביות באיכות. חלק מהפרויקטים יכללו שימוש בכלי אוטומטי לניקוי, צבירה ודחיסה לפני שהנתונים מועברים למיקומם הסופי. Azure Data Factory הוא דוגמה לאחד מהכלים הללו.
+
+### אבטחת נתונים
+אחד היעדים המרכזיים של אבטחת נתונים הוא להבטיח שמי שעובד עם הנתונים שולט במה שנאסף ובאיזה הקשר נעשה בו שימוש. שמירה על אבטחת נתונים כוללת הגבלת גישה רק למי שזקוק לה, עמידה בחוקים ובתקנות המקומיים, כמו גם שמירה על סטנדרטים אתיים, כפי שנלמד בשיעור על [אתיקה](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/1-Introduction/02-ethics).
+
+הנה כמה דברים שצוות עשוי לעשות מתוך מחשבה על אבטחה:
+- לוודא שכל הנתונים מוצפנים
+- לספק ללקוחות מידע על איך הנתונים שלהם משמשים
+- להסיר גישה לנתונים ממי שעזב את הפרויקט
+- לאפשר רק לחברי צוות מסוימים לשנות את הנתונים
+
+## 🚀 אתגר
+
+ישנם גרסאות רבות למחזור החיים של מדעי הנתונים, כאשר כל שלב עשוי להיקרא בשם שונה או לכלול מספר שונה של שלבים, אך יכיל את אותם תהליכים שהוזכרו בשיעור זה.
+
+חקור את [מחזור החיים של תהליך מדעי הנתונים של הצוות](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/lifecycle) ואת [התקן התעשייתי לתהליך כריית נתונים](https://www.datascience-pm.com/crisp-dm-2/). ציין 3 דמיון ו-3 הבדלים בין השניים.
+
+|תהליך מדעי הנתונים של הצוות (TDSP)|התקן התעשייתי לתהליך כריית נתונים (CRISP-DM)|
+|--|--|
+| |  |
+| תמונה מאת [Microsoft](https://docs.microsoft.comazure/architecture/data-science-process/lifecycle) | תמונה מאת [Data Science Process Alliance](https://www.datascience-pm.com/crisp-dm-2/) |
+
+## [שאלון אחרי השיעור](https://red-water-0103e7a0f.azurestaticapps.net/quiz/27)
+
+## סקירה ולימוד עצמי
+
+יישום מחזור החיים של מדעי הנתונים כולל תפקידים ומשימות מרובים, כאשר חלקם עשויים להתמקד בחלקים מסוימים בכל שלב. תהליך מדעי הנתונים של הצוות מספק כמה משאבים שמסבירים את סוגי התפקידים והמשימות שמישהו עשוי לבצע בפרויקט.
+
+* [תפקידים ומשימות בתהליך מדעי הנתונים של הצוות](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/roles-tasks)
+* [ביצוע משימות מדעי נתונים: חקר, בניית מודלים ופריסה](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/execute-data-science-tasks)
+
+## משימה
+
+[הערכת מערך נתונים](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/4-Data-Science-Lifecycle/14-Introduction/assignment.md b/translations/he/4-Data-Science-Lifecycle/14-Introduction/assignment.md
new file mode 100644
index 00000000..ad6c291a
--- /dev/null
+++ b/translations/he/4-Data-Science-Lifecycle/14-Introduction/assignment.md
@@ -0,0 +1,37 @@
+
+# הערכת מערך נתונים
+
+לקוח פנה לצוות שלכם בבקשה לעזרה בחקירת הרגלי ההוצאה העונתיים של נוסעי מוניות בניו יורק.
+
+הם רוצים לדעת: **האם נוסעי מוניות צהובות בניו יורק נותנים טיפ גבוה יותר לנהגים בחורף או בקיץ?**
+
+הצוות שלכם נמצא בשלב ה-[איסוף](Readme.md#Capturing) במחזור החיים של מדעי הנתונים, ואתם אחראים על הטיפול במערך הנתונים. סופקו לכם מחברת ו-[נתונים](../../../../data/taxi.csv) לחקור.
+
+בתיקייה זו יש [מחברת](notebook.ipynb) שמשתמשת ב-Python לטעינת נתוני נסיעות במוניות צהובות מתוך [נציבות המוניות והלימוזינות של ניו יורק](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets).
+ניתן גם לפתוח את קובץ הנתונים של המוניות בעורך טקסט או בתוכנה לגיליונות אלקטרוניים כמו Excel.
+
+## הוראות
+
+- העריכו האם הנתונים במערך הנתונים הזה יכולים לעזור לענות על השאלה.
+- חקרו את [קטלוג הנתונים הפתוחים של ניו יורק](https://data.cityofnewyork.us/browse?sortBy=most_accessed&utf8=%E2%9C%93). זהו מערך נתונים נוסף שיכול להיות מועיל במתן תשובה לשאלת הלקוח.
+- כתבו 3 שאלות שהייתם שואלים את הלקוח לצורך הבהרה והבנה טובה יותר של הבעיה.
+
+עיינו ב-[מילון הנתונים](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) וב-[מדריך המשתמש](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) למידע נוסף על הנתונים.
+
+## קריטריונים להערכה
+
+מצוין | מספק | דורש שיפור
+--- | --- | ---
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/4-Data-Science-Lifecycle/15-analyzing/README.md b/translations/he/4-Data-Science-Lifecycle/15-analyzing/README.md
new file mode 100644
index 00000000..276dc467
--- /dev/null
+++ b/translations/he/4-Data-Science-Lifecycle/15-analyzing/README.md
@@ -0,0 +1,62 @@
+
+# מחזור החיים של מדעי הנתונים: ניתוח
+
+| ](../../sketchnotes/15-Analyzing.png)|
+|:---:|
+| מחזור החיים של מדעי הנתונים: ניתוח - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+## שאלון לפני השיעור
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/28)
+
+השלב של ניתוח במחזור החיים של הנתונים מאשר שהנתונים יכולים לענות על השאלות שהוצעו או לפתור בעיה מסוימת. שלב זה יכול גם להתמקד באישור שהמודל מתמודד בצורה נכונה עם השאלות והבעיות הללו. השיעור הזה מתמקד בניתוח נתונים חקרני (EDA), שהוא טכניקות להגדרת מאפיינים וקשרים בתוך הנתונים וניתן להשתמש בהם להכנת הנתונים למידול.
+
+נשתמש במאגר נתונים לדוגמה מ-[Kaggle](https://www.kaggle.com/balaka18/email-spam-classification-dataset-csv/version/1) כדי להראות כיצד ניתן ליישם זאת עם Python וספריית Pandas. מאגר הנתונים הזה מכיל ספירה של כמה מילים נפוצות שנמצאו באימיילים, כאשר מקורות האימיילים הללו הם אנונימיים. השתמשו ב-[מחברת](notebook.ipynb) שבספרייה הזו כדי לעקוב.
+
+## ניתוח נתונים חקרני
+
+שלב הלכידה במחזור החיים הוא המקום שבו הנתונים נאספים יחד עם הבעיות והשאלות הקיימות, אבל איך נדע שהנתונים יכולים לתמוך בתוצאה הסופית?
+זכרו שמדען נתונים עשוי לשאול את השאלות הבאות כשהוא מקבל את הנתונים:
+- האם יש לי מספיק נתונים כדי לפתור את הבעיה הזו?
+- האם איכות הנתונים מספקת עבור הבעיה הזו?
+- אם אני מגלה מידע נוסף דרך הנתונים האלה, האם כדאי לשקול לשנות או להגדיר מחדש את המטרות?
+
+ניתוח נתונים חקרני הוא התהליך של היכרות עם הנתונים וניתן להשתמש בו כדי לענות על השאלות הללו, כמו גם לזהות את האתגרים בעבודה עם מאגר הנתונים. בואו נתמקד בכמה מהטכניקות שמשתמשים בהן כדי להשיג זאת.
+
+## פרופיל נתונים, סטטיסטיקה תיאורית ו-Pandas
+איך נוכל להעריך אם יש לנו מספיק נתונים כדי לפתור את הבעיה הזו? פרופיל נתונים יכול לסכם ולאסוף מידע כללי על מאגר הנתונים שלנו באמצעות טכניקות של סטטיסטיקה תיאורית. פרופיל נתונים עוזר לנו להבין מה זמין לנו, וסטטיסטיקה תיאורית עוזרת לנו להבין כמה דברים זמינים לנו.
+
+בכמה מהשיעורים הקודמים השתמשנו ב-Pandas כדי לספק סטטיסטיקה תיאורית עם הפונקציה [`describe()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html). היא מספקת את הספירה, הערכים המקסימליים והמינימליים, ממוצע, סטיית תקן וקוונטילים על הנתונים המספריים. שימוש בסטטיסטיקה תיאורית כמו הפונקציה `describe()` יכול לעזור לכם להעריך כמה יש לכם ואם אתם צריכים יותר.
+
+## דגימה ושאילתות
+ניתוח כל הנתונים במאגר גדול יכול להיות מאוד גוזל זמן ומשימה שבדרך כלל נשארת למחשב לבצע. עם זאת, דגימה היא כלי מועיל להבנת הנתונים ומאפשרת לנו להבין טוב יותר מה נמצא במאגר הנתונים ומה הוא מייצג. עם דגימה, ניתן ליישם הסתברות וסטטיסטיקה כדי להגיע למסקנות כלליות על הנתונים שלכם. למרות שאין כלל מוגדר לגבי כמה נתונים כדאי לדגום, חשוב לציין שככל שתדגמו יותר נתונים, כך תוכלו להגיע להכללה מדויקת יותר על הנתונים.
+
+ל-Pandas יש את הפונקציה [`sample()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sample.html) בספרייה שלה, שבה ניתן להעביר ארגומנט של כמה דגימות אקראיות תרצו לקבל ולהשתמש בהן.
+
+שאילתות כלליות על הנתונים יכולות לעזור לכם לענות על שאלות ותיאוריות כלליות שיש לכם. בניגוד לדגימה, שאילתות מאפשרות לכם לשלוט ולהתמקד בחלקים ספציפיים של הנתונים שיש לכם שאלות לגביהם.
+הפונקציה [`query()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.query.html) בספריית Pandas מאפשרת לכם לבחור עמודות ולקבל תשובות פשוטות על הנתונים דרך השורות שהתקבלו.
+
+## ניתוח באמצעות ויזואליזציות
+אין צורך להמתין עד שהנתונים יהיו נקיים ומנותחים לחלוטין כדי להתחיל ליצור ויזואליזציות. למעשה, ייצוג חזותי בזמן הניתוח יכול לעזור לזהות דפוסים, קשרים ובעיות בנתונים. יתרה מכך, ויזואליזציות מספקות אמצעי תקשורת עם אלו שאינם מעורבים בניהול הנתונים ויכולות להיות הזדמנות לשתף ולהבהיר שאלות נוספות שלא טופלו בשלב הלכידה. עיינו ב-[החלק על ויזואליזציות](../../../../../../../../../3-Data-Visualization) כדי ללמוד עוד על כמה דרכים פופולריות לנתח חזותית.
+
+## ניתוח לזיהוי אי עקביות
+כל הנושאים בשיעור הזה יכולים לעזור לזהות ערכים חסרים או לא עקביים, אבל Pandas מספקת פונקציות לבדוק חלק מהם. [isna() או isnull()](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.isna.html) יכולות לבדוק ערכים חסרים. חלק חשוב בניתוח הערכים הללו בתוך הנתונים שלכם הוא לחקור מדוע הם הגיעו למצב הזה מלכתחילה. זה יכול לעזור לכם להחליט אילו [פעולות לנקוט כדי לפתור אותם](/2-Working-With-Data/08-data-preparation/notebook.ipynb).
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/27)
+
+## משימה
+
+[ניתוח לתשובות](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/4-Data-Science-Lifecycle/15-analyzing/assignment.md b/translations/he/4-Data-Science-Lifecycle/15-analyzing/assignment.md
new file mode 100644
index 00000000..06fae853
--- /dev/null
+++ b/translations/he/4-Data-Science-Lifecycle/15-analyzing/assignment.md
@@ -0,0 +1,36 @@
+
+# חיפוש תשובות
+
+זהו המשך למשימה מהשיעור הקודם [assignment](../14-Introduction/assignment.md), שבו הסתכלנו בקצרה על מערך הנתונים. עכשיו נעמיק יותר במערך הנתונים.
+
+שוב, השאלה שהלקוח רוצה לדעת: **האם נוסעי מוניות צהובות בניו יורק נותנים טיפ לנהגים יותר בחורף או בקיץ?**
+
+הצוות שלכם נמצא בשלב [Analyzing](README.md) במחזור החיים של מדע הנתונים, שבו אתם אחראים לבצע ניתוח נתונים חקרני על מערך הנתונים. סופקו לכם מחברת ומערך נתונים המכילים 200 עסקאות מוניות מינואר ויולי 2019.
+
+## הוראות
+
+בתיקייה זו נמצאים [notebook](assignment.ipynb) ונתונים מ-[Taxi & Limousine Commission](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets). עיינו ב-[מילון הנתונים](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) וב-[מדריך המשתמש](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) למידע נוסף על הנתונים.
+
+השתמשו בכמה מהטכניקות שנלמדו בשיעור זה כדי לבצע ניתוח נתונים חקרני משלכם במחברת (הוסיפו תאים אם תרצו) וענו על השאלות הבאות:
+
+- אילו גורמים נוספים בנתונים עשויים להשפיע על סכום הטיפ?
+- אילו עמודות ככל הנראה לא יהיו נחוצות כדי לענות על שאלות הלקוח?
+- בהתבסס על מה שסופק עד כה, האם הנתונים מספקים עדות כלשהי להתנהגות עונתית במתן טיפים?
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | ---
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/4-Data-Science-Lifecycle/16-communication/README.md b/translations/he/4-Data-Science-Lifecycle/16-communication/README.md
new file mode 100644
index 00000000..aef30a91
--- /dev/null
+++ b/translations/he/4-Data-Science-Lifecycle/16-communication/README.md
@@ -0,0 +1,222 @@
+
+# מחזור החיים של מדעי הנתונים: תקשורת
+
+|](../../sketchnotes/16-Communicating.png)|
+|:---:|
+| מחזור החיים של מדעי הנתונים: תקשורת - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+## [מבחן מקדים להרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/30)
+
+בדקו את הידע שלכם על מה שעתיד לבוא עם המבחן המקדים להרצאה למעלה!
+
+# מבוא
+
+### מהי תקשורת?
+נתחיל את השיעור הזה בהגדרת המונח תקשורת. **לתקשר פירושו להעביר או להחליף מידע.** מידע יכול להיות רעיונות, מחשבות, רגשות, מסרים, אותות סמויים, נתונים – כל דבר ש**_שולח_** (מי שמעביר מידע) רוצה ש**_מקבל_** (מי שמקבל מידע) יבין. בשיעור הזה נתייחס לשולחים כאל מתקשרים ולמקבלים כאל קהל.
+
+### תקשורת נתונים וסיפור סיפורים
+אנו מבינים שכאשר מתקשרים, המטרה היא להעביר או להחליף מידע. אבל כשמדובר בתקשורת נתונים, המטרה שלכם לא צריכה להיות רק להעביר מספרים לקהל שלכם. המטרה שלכם צריכה להיות לספר סיפור שמבוסס על הנתונים שלכם – תקשורת נתונים אפקטיבית וסיפור סיפורים הולכים יד ביד. הקהל שלכם יזכור סיפור שאתם מספרים יותר מאשר מספרים שתציגו. בהמשך השיעור נדון בכמה דרכים שבהן תוכלו להשתמש בסיפור סיפורים כדי לתקשר את הנתונים שלכם בצורה יעילה יותר.
+
+### סוגי תקשורת
+במהלך השיעור נדון בשני סוגים שונים של תקשורת: תקשורת חד-כיוונית ותקשורת דו-כיוונית.
+
+**תקשורת חד-כיוונית** מתרחשת כאשר שולח מעביר מידע למקבל, ללא משוב או תגובה. אנו רואים דוגמאות לתקשורת חד-כיוונית מדי יום – במיילים המוניים, כאשר החדשות מעבירות את הסיפורים האחרונים, או אפילו כאשר פרסומת טלוויזיה מופיעה ומספרת לכם מדוע המוצר שלהם נהדר. בכל אחד מהמקרים הללו, השולח אינו מחפש החלפת מידע. הוא רק מבקש להעביר או למסור מידע.
+
+**תקשורת דו-כיוונית** מתרחשת כאשר כל הצדדים המעורבים פועלים הן כשולחים והן כמקבלים. שולח יתחיל בתקשורת עם מקבל, והמקבל יספק משוב או תגובה. תקשורת דו-כיוונית היא מה שאנו בדרך כלל חושבים עליו כשמדברים על תקשורת. אנו בדרך כלל חושבים על אנשים המשתתפים בשיחה – בין אם פנים אל פנים, בשיחת טלפון, ברשתות חברתיות או בהודעות טקסט.
+
+כשמדובר בתקשורת נתונים, יהיו מקרים שבהם תשתמשו בתקשורת חד-כיוונית (לדוגמה, הצגת נתונים בכנס או בפני קהל גדול שבו לא יישאלו שאלות מיד לאחר מכן) ויהיו מקרים שבהם תשתמשו בתקשורת דו-כיוונית (לדוגמה, שימוש בנתונים כדי לשכנע כמה בעלי עניין לתמוך ברעיון, או לשכנע עמית להשקיע זמן ומאמץ בבניית משהו חדש).
+
+# תקשורת אפקטיבית
+
+### האחריות שלכם כמתקשרים
+כאשר אתם מתקשרים, זו האחריות שלכם לוודא שהמקבלים שלכם מבינים את המידע שאתם רוצים שהם יבינו. כשאתם מתקשרים נתונים, אתם לא רוצים שהמקבלים שלכם ייקחו רק מספרים – אתם רוצים שהם ייקחו סיפור שמבוסס על הנתונים שלכם. מתקשר נתונים טוב הוא מספר סיפורים טוב.
+
+איך מספרים סיפור עם נתונים? יש אינסוף דרכים – אבל להלן 6 דרכים שנדון בהן בשיעור הזה:
+1. להבין את הקהל שלכם, את הערוץ שלכם ואת שיטת התקשורת שלכם
+2. להתחיל עם הסוף בראש
+3. לגשת לזה כמו סיפור אמיתי
+4. להשתמש במילים ובביטויים משמעותיים
+5. להשתמש ברגש
+
+כל אחת מהאסטרטגיות הללו מוסברת בפירוט בהמשך.
+
+### 1. להבין את הקהל שלכם, את הערוץ שלכם ואת שיטת התקשורת שלכם
+הדרך שבה אתם מתקשרים עם בני משפחה כנראה שונה מהדרך שבה אתם מתקשרים עם חברים. אתם כנראה משתמשים במילים ובביטויים שונים שהאנשים שאתם מדברים איתם יבינו טוב יותר. עליכם לנקוט בגישה דומה כשאתם מתקשרים נתונים. חשבו על מי אתם מתקשרים אליו. חשבו על המטרות שלו ועל ההקשר שיש לו לגבי המצב שאתם מסבירים לו.
+
+אתם יכולים כנראה לקבץ את רוב הקהל שלכם לקטגוריה מסוימת. במאמר של _Harvard Business Review_, "[How to Tell a Story with Data](http://blogs.hbr.org/2013/04/how-to-tell-a-story-with-data/)," האסטרטג הראשי של Dell, ג'ים סטיקלדר, מזהה חמש קטגוריות של קהלים:
+
+- **מתחילים**: חשיפה ראשונה לנושא, אך לא רוצים פשטנות יתר
+- **כלליים**: מודעים לנושא, אך מחפשים הבנה כללית ונושאים מרכזיים
+- **ניהוליים**: הבנה מעמיקה וניתנת לפעולה של מורכבויות וקשרים עם גישה לפרטים
+- **מומחים**: יותר חקר וגילוי ופחות סיפור סיפורים עם פרטים רבים
+- **מנהלים בכירים**: יש להם זמן רק להבין את המשמעות והמסקנות של הסתברויות משוקללות
+
+קטגוריות אלו יכולות להנחות את הדרך שבה אתם מציגים נתונים לקהל שלכם.
+
+בנוסף לחשיבה על קטגוריית הקהל שלכם, עליכם גם לשקול את הערוץ שבו אתם מתקשרים עם הקהל שלכם. הגישה שלכם צריכה להיות מעט שונה אם אתם כותבים מזכר או מייל לעומת קיום פגישה או הצגה בכנס.
+
+מעבר להבנת הקהל שלכם, חשוב גם לדעת כיצד תתקשרו איתו (באמצעות תקשורת חד-כיוונית או דו-כיוונית).
+
+אם אתם מתקשרים עם קהל שרובו מתחילים ומשתמשים בתקשורת חד-כיוונית, עליכם קודם כל לחנך את הקהל ולתת לו הקשר מתאים. לאחר מכן עליכם להציג את הנתונים שלכם ולהסביר מה הם אומרים ולמה הם חשובים. במקרה כזה, כדאי להתמקד בבהירות, מכיוון שהקהל שלכם לא יוכל לשאול אתכם שאלות ישירות.
+
+אם אתם מתקשרים עם קהל שרובו ניהולי ומשתמשים בתקשורת דו-כיוונית, כנראה שלא תצטרכו לחנך את הקהל שלכם או לספק לו הרבה הקשר. תוכלו לקפוץ ישר לדיון על הנתונים שאספתם ולמה הם חשובים. בתרחיש הזה, כדאי להתמקד בתזמון ובשליטה בהצגה שלכם. כאשר משתמשים בתקשורת דו-כיוונית (במיוחד עם קהל ניהולי שמחפש "הבנה ניתנת לפעולה של מורכבויות וקשרים עם גישה לפרטים"), עשויות לצוץ שאלות במהלך האינטראקציה שלכם שעלולות להוביל את הדיון לכיוון שאינו קשור לסיפור שאתם מנסים לספר. כאשר זה קורה, תוכלו לנקוט פעולה ולהחזיר את הדיון למסלול עם הסיפור שלכם.
+
+### 2. להתחיל עם הסוף בראש
+להתחיל עם הסוף בראש פירושו להבין את המסקנות הרצויות שלכם עבור הקהל לפני שאתם מתחילים לתקשר איתו. מחשבה מראש על מה שאתם רוצים שהקהל שלכם ייקח יכולה לעזור לכם לבנות סיפור שהקהל שלכם יכול לעקוב אחריו. להתחיל עם הסוף בראש מתאים הן לתקשורת חד-כיוונית והן לתקשורת דו-כיוונית.
+
+איך מתחילים עם הסוף בראש? לפני שאתם מתקשרים את הנתונים שלכם, כתבו את המסקנות המרכזיות שלכם. לאחר מכן, בכל שלב בדרך כשאתם מכינים את הסיפור שאתם רוצים לספר עם הנתונים שלכם, שאלו את עצמכם, "איך זה משתלב בסיפור שאני מספר?"
+
+שימו לב – בעוד שהתחלה עם הסוף בראש היא אידיאלית, אתם לא רוצים לתקשר רק את הנתונים שתומכים במסקנות הרצויות שלכם. פעולה זו נקראת Cherry-Picking, והיא מתרחשת כאשר מתקשר מעביר רק נתונים שתומכים בנקודה שהוא מנסה להציג ומתעלם מכל הנתונים האחרים.
+
+אם כל הנתונים שאספתם תומכים בבירור במסקנות הרצויות שלכם, נהדר. אבל אם יש נתונים שאספתם שאינם תומכים במסקנות שלכם, או אפילו תומכים בטיעון נגד המסקנות המרכזיות שלכם, עליכם לתקשר גם את הנתונים הללו. אם זה קורה, היו כנים עם הקהל שלכם והסבירו מדוע אתם בוחרים להישאר עם הסיפור שלכם למרות שכל הנתונים לא בהכרח תומכים בו.
+
+### 3. לגשת לזה כמו סיפור אמיתי
+סיפור מסורתי מתרחש ב-5 שלבים. ייתכן ששמעתם על שלבים אלו כחשיפה, פעולה מתגברת, שיא, פעולה יורדת וסיום. או בצורה קלה יותר לזכור: הקשר, קונפליקט, שיא, סגירה, מסקנה. כשאתם מתקשרים את הנתונים שלכם ואת הסיפור שלכם, תוכלו לנקוט בגישה דומה.
+
+תוכלו להתחיל עם הקשר, להגדיר את הבמה ולוודא שהקהל שלכם נמצא באותו עמוד. לאחר מכן הציגו את הקונפליקט. מדוע היה צורך לאסוף את הנתונים הללו? אילו בעיות ניסיתם לפתור? לאחר מכן, השיא. מהם הנתונים? מה הם אומרים? אילו פתרונות הנתונים מציעים לנו? לאחר מכן מגיעים לסגירה, שבה תוכלו לחזור על הבעיה והפתרון המוצע. לבסוף, מגיעים למסקנה, שבה תוכלו לסכם את המסקנות המרכזיות שלכם ואת הצעדים הבאים שאתם ממליצים לצוות לנקוט.
+
+### 4. להשתמש במילים ובביטויים משמעותיים
+אם אני ואתם עובדים יחד על מוצר, ואני אומר לכם "למשתמשים שלנו לוקח זמן רב להירשם לפלטפורמה שלנו," כמה זמן הייתם מעריכים ש"זמן רב" הוא? שעה? שבוע? קשה לדעת. מה אם הייתי אומר את זה לקהל שלם? כל אחד בקהל עשוי להגיע למסקנה שונה לגבי כמה זמן לוקח למשתמשים להירשם לפלטפורמה שלנו.
+
+לעומת זאת, מה אם הייתי אומר "למשתמשים שלנו לוקח, בממוצע, 3 דקות להירשם ולהתחבר לפלטפורמה שלנו."
+
+המסר הזה ברור יותר. כשאתם מתקשרים נתונים, קל לחשוב שכל הקהל שלכם חושב בדיוק כמוכם. אבל זה לא תמיד המקרה. יצירת בהירות סביב הנתונים שלכם ומה הם אומרים היא אחת מהאחריות שלכם כמתקשרים. אם הנתונים או הסיפור שלכם אינם ברורים, הקהל שלכם יתקשה לעקוב, וסביר פחות שהוא יבין את המסקנות המרכזיות שלכם.
+
+תוכלו לתקשר נתונים בצורה ברורה יותר כשאתם משתמשים במילים ובביטויים משמעותיים במקום מעורפלים. להלן כמה דוגמאות:
+
+- הייתה לנו שנה *מרשימה*!
+ - אדם אחד עשוי לחשוב שמרשים פירושו עלייה של 2% - 3% בהכנסות, ואדם אחר עשוי לחשוב שזה אומר עלייה של 50% - 60%.
+- שיעורי ההצלחה של המשתמשים שלנו עלו *באופן דרמטי*.
+ - כמה גדולה העלייה שהיא דרמטית?
+- המיזם הזה ידרוש *מאמץ משמעותי*.
+ - כמה מאמץ הוא משמעותי?
+
+שימוש במילים מעורפלות יכול להיות שימושי כהקדמה לנתונים נוספים שמגיעים, או כסיכום של הסיפור שסיפרתם זה עתה. אבל שקלו לוודא שכל חלק מהמצגת שלכם ברור לקהל שלכם.
+
+### 5. להשתמש ברגש
+רגש הוא מפתח בסיפור סיפורים. הוא אפילו חשוב יותר כשאתם מספרים סיפור עם נתונים. כשאתם מתקשרים נתונים, הכל מתמקד במסקנות שאתם רוצים שהקהל שלכם ייקח. כשאתם מעוררים רגש אצל הקהל, זה עוזר לו להזדהות, ומגדיל את הסיכוי שהוא יפעל. רגש גם מגדיל את הסיכוי שהקהל יזכור את המסר שלכם.
+
+ייתכן שנתקלתם בזה בעבר עם פרסומות טלוויזיה. חלק מהפרסומות מאוד רציניות ומשתמשות ברגש עצוב כדי להתחבר לקהל שלהן ולהבליט את הנתונים שהן מציגות. או, חלק מהפרסומות מאוד עליזות ושמחות, ועשויות לגרום לכם לקשר את הנתונים שלהן עם תחושה שמחה.
+
+איך משתמשים ברגש כשמתקשרים נתונים? להלן כמה דרכים:
+
+- השתמשו בעדויות וסיפורים אישיים
+ - כשאתם אוספים נתונים, נסו לאסוף גם נתונים כמותיים וגם נתונים איכותניים, ושילבו את שני סוגי הנתונים כשאתם מתקשרים. אם הנתונים שלכם הם בעיקר כמותיים, חפשו סיפורים מאנשים כדי ללמוד יותר על החוויה שלהם עם מה שהנתונים שלכם מספרים.
+- השתמשו בדימויים
+ - תמונות עוזרות לקהל לראות את עצמו במצב. כשאתם משתמשים בתמונות, תוכלו לכוון את הקהל לרגש שאתם מרגישים שהוא צריך לחוש לגבי הנתונים שלכם.
+- השתמשו בצבע
+ - צבעים שונים מעוררים רגשות שונים. צבעים פופולריים והרגשות שהם מעוררים מפורטים להלן. שימו לב, שצבעים עשויים להיות בעלי משמעויות שונות בתרבויות שונות.
+ - כחול בדרך כלל מעורר רגשות של שלווה ואמון
+ - ירוק בדרך כלל קשור לטבע ולסביבה
+ - אדום בדרך כלל מייצג תשוקה והתרגשות
+ - צהוב בדרך כלל מייצג אופטימיות ושמחה
+
+# מקרה מבחן בתקשורת
+אמרסון הוא מנהל מוצר של אפליקציה לנייד. אמרסון שם לב שלקוחות מגישים 42% יותר תלונות ודיווחים על באגים בסופי שבוע. אמרסון גם שם לב שלקוחות שמגישים תלונה שלא נענית לאחר 48 שעות נוטים ב-32% יותר לתת לאפליקציה דירוג של 1 או 2 בחנות האפליקציות.
+
+לאחר ביצוע מחקר, אמרסון מצא כמה פתרונות שיטפלו בבעיה. אמרסון קובע פגישה של 30 דקות עם שלושת מנהיגי החברה כדי לתקשר את הנתונים ואת הפתרונות המוצעים.
+
+במהלך הפגישה הזו, המטרה של אמרסון היא לגרום למנהיגי החברה להבין ששני הפתרונות הבאים יכולים לשפר את דירוג האפליקציה, מה שסביר להניח שיתורגם להכנסות גבוהות יותר.
+
+**פתרון 1.** להעסיק נציגי שירות לקוחות שיעבדו בסופי שבוע
+
+**פתרון 2.** לרכוש מערכת כרטוס חדשה לשירות לקוחות שבה נציגי שירות לקוחות יכולים לזהות בקלות אילו תלונות נמצאות בתור הכי הרבה זמן – כך שהם יוכלו לדעת אילו לטפל בהן באופן מיידי.
+בפגישה, אמרסון הקדיש 5 דקות להסביר מדוע דירוג נמוך בחנות האפליקציות הוא בעייתי, 10 דקות להסביר את תהליך המחקר ואיך זוהו המגמות, 10 דקות לעבור על כמה מתלונות הלקוחות האחרונות, וב-5 הדקות האחרונות לסקור בקצרה את שתי הפתרונות האפשריים.
+
+האם זו הייתה דרך אפקטיבית עבור אמרסון לתקשר במהלך הפגישה?
+
+במהלך הפגישה, אחד ממנהלי החברה התמקד ב-10 הדקות שבהן אמרסון עבר על תלונות הלקוחות. לאחר הפגישה, התלונות היו הדבר היחיד שמנהל זה זכר. מנהל אחר התמקד בעיקר בתיאור תהליך המחקר על ידי אמרסון. המנהל השלישי זכר את הפתרונות שהוצעו על ידי אמרסון, אך לא היה בטוח כיצד ניתן ליישם אותם.
+
+במצב שתואר לעיל, ניתן לראות פער משמעותי בין מה שאמרסון רצה שהמנהלים ייקחו מהפגישה לבין מה שהם בפועל לקחו ממנה. להלן גישה אחרת שאמרסון יכול לשקול.
+
+איך אמרסון יכול לשפר את הגישה הזו?
+הקשר, קונפליקט, שיא, סגירה, מסקנה
+**הקשר** - אמרסון יכול להקדיש את 5 הדקות הראשונות להצגת המצב כולו ולוודא שהמנהלים מבינים כיצד הבעיות משפיעות על מדדים קריטיים לחברה, כמו הכנסות.
+
+זה יכול להיות מוצג כך: "כרגע, הדירוג של האפליקציה שלנו בחנות האפליקציות הוא 2.5. דירוגים בחנות האפליקציות הם קריטיים לאופטימיזציה בחנות האפליקציות, שמשפיעה על כמה משתמשים רואים את האפליקציה שלנו בחיפוש, ואיך האפליקציה שלנו נתפסת בעיני משתמשים פוטנציאליים. וכמובן, מספר המשתמשים שלנו קשור ישירות להכנסות."
+
+**קונפליקט** אמרסון יכול לעבור לדבר במשך כ-5 דקות על הקונפליקט.
+
+זה יכול להישמע כך: "משתמשים מגישים 42% יותר תלונות ודיווחים על באגים בסופי שבוע. לקוחות שמגישים תלונה שלא נענית תוך 48 שעות נוטים ב-32% פחות לתת לאפליקציה שלנו דירוג מעל 2 בחנות האפליקציות. שיפור הדירוג של האפליקציה שלנו בחנות האפליקציות ל-4 ישפר את הנראות שלנו ב-20-30%, מה שאני מעריך יגדיל את ההכנסות ב-10%." כמובן, אמרסון צריך להיות מוכן להצדיק את המספרים הללו.
+
+**שיא** לאחר הנחת היסודות, אמרסון יכול לעבור לשיא במשך כ-5 דקות.
+
+אמרסון יכול להציג את הפתרונות המוצעים, לפרט כיצד הפתרונות הללו יטפלו בבעיות שהוצגו, כיצד ניתן לשלב את הפתרונות בתהליכי העבודה הקיימים, כמה הפתרונות יעלו, מה יהיה החזר ההשקעה של הפתרונות, ואולי אפילו להציג צילומי מסך או סקיצות של איך הפתרונות ייראו אם ייושמו. אמרסון יכול גם לשתף עדויות ממשתמשים שחיכו מעל 48 שעות לתשובה לתלונתם, ואפילו עדות מנציג שירות לקוחות בחברה שיש לו הערות על מערכת הכרטיסים הנוכחית.
+
+**סגירה** עכשיו אמרסון יכול להקדיש 5 דקות לחזור על הבעיות שהחברה מתמודדת איתן, לעבור שוב על הפתרונות המוצעים, ולסקור מדוע הפתרונות הללו הם הנכונים.
+
+**מסקנה** מכיוון שמדובר בפגישה עם מספר בעלי עניין שבה תתקיים תקשורת דו-כיוונית, אמרסון יכול לתכנן להשאיר 10 דקות לשאלות, כדי לוודא שכל דבר שהיה מבלבל למנהלים יובהר לפני סיום הפגישה.
+
+אם אמרסון ינקוט בגישה #2, סביר הרבה יותר שהמנהלים ייקחו מהפגישה בדיוק את מה שאמרסון התכוון שהם ייקחו – שהדרך שבה מטפלים בתלונות ובבאגים יכולה להשתפר, וישנם שני פתרונות שניתן ליישם כדי לגרום לשיפור הזה לקרות. גישה זו תהיה הרבה יותר אפקטיבית בהעברת הנתונים והסיפור שאמרסון רוצה להעביר.
+
+# מסקנה
+### סיכום נקודות עיקריות
+- לתקשר פירושו להעביר או להחליף מידע.
+- כאשר מתקשרים נתונים, המטרה שלך לא צריכה להיות רק להעביר מספרים לקהל שלך. המטרה שלך צריכה להיות לתקשר סיפור שמבוסס על הנתונים שלך.
+- ישנם שני סוגי תקשורת: תקשורת חד-כיוונית (מידע מועבר ללא כוונה לקבל תגובה) ותקשורת דו-כיוונית (מידע מועבר הלוך ושוב).
+- ישנן אסטרטגיות רבות שניתן להשתמש בהן כדי לספר סיפור עם הנתונים שלך. 5 אסטרטגיות שדיברנו עליהן הן:
+ - להבין את הקהל שלך, את המדיום שלך ואת שיטת התקשורת שלך
+ - להתחיל עם הסוף בראש
+ - לגשת לזה כמו סיפור אמיתי
+ - להשתמש במילים ובביטויים משמעותיים
+ - להשתמש ברגש
+
+### משאבים מומלצים ללימוד עצמי
+[The Five C's of Storytelling - Articulate Persuasion](http://articulatepersuasion.com/the-five-cs-of-storytelling/)
+
+[1.4 Your Responsibilities as a Communicator – Business Communication for Success (umn.edu)](https://open.lib.umn.edu/businesscommunication/chapter/1-4-your-responsibilities-as-a-communicator/)
+
+[How to Tell a Story with Data (hbr.org)](https://hbr.org/2013/04/how-to-tell-a-story-with-data)
+
+[Two-Way Communication: 4 Tips for a More Engaged Workplace (yourthoughtpartner.com)](https://www.yourthoughtpartner.com/blog/bid/59576/4-steps-to-increase-employee-engagement-through-two-way-communication)
+
+[6 succinct steps to great data storytelling - BarnRaisers, LLC (barnraisersllc.com)](https://barnraisersllc.com/2021/05/02/6-succinct-steps-to-great-data-storytelling/)
+
+[How to Tell a Story With Data | Lucidchart Blog](https://www.lucidchart.com/blog/how-to-tell-a-story-with-data)
+
+[6 Cs of Effective Storytelling on Social Media | Cooler Insights](https://coolerinsights.com/2018/06/effective-storytelling-social-media/)
+
+[The Importance of Emotions In Presentations | Ethos3 - A Presentation Training and Design Agency](https://ethos3.com/2015/02/the-importance-of-emotions-in-presentations/)
+
+[Data storytelling: linking emotions and rational decisions (toucantoco.com)](https://www.toucantoco.com/en/blog/data-storytelling-dataviz)
+
+[Emotional Advertising: How Brands Use Feelings to Get People to Buy (hubspot.com)](https://blog.hubspot.com/marketing/emotions-in-advertising-examples)
+
+[Choosing Colors for Your Presentation Slides | Think Outside The Slide](https://www.thinkoutsidetheslide.com/choosing-colors-for-your-presentation-slides/)
+
+[How To Present Data [10 Expert Tips] | ObservePoint](https://resources.observepoint.com/blog/10-tips-for-presenting-data)
+
+[Microsoft Word - Persuasive Instructions.doc (tpsnva.org)](https://www.tpsnva.org/teach/lq/016/persinstr.pdf)
+
+[The Power of Story for Your Data (thinkhdi.com)](https://www.thinkhdi.com/library/supportworld/2019/power-story-your-data.aspx)
+
+[Common Mistakes in Data Presentation (perceptualedge.com)](https://www.perceptualedge.com/articles/ie/data_presentation.pdf)
+
+[Infographic: Here are 15 Common Data Fallacies to Avoid (visualcapitalist.com)](https://www.visualcapitalist.com/here-are-15-common-data-fallacies-to-avoid/)
+
+[Cherry Picking: When People Ignore Evidence that They Dislike – Effectiviology](https://effectiviology.com/cherry-picking/#How_to_avoid_cherry_picking)
+
+[Tell Stories with Data: Communication in Data Science | by Sonali Verghese | Towards Data Science](https://towardsdatascience.com/tell-stories-with-data-communication-in-data-science-5266f7671d7)
+
+[1. Communicating Data - Communicating Data with Tableau [Book] (oreilly.com)](https://www.oreilly.com/library/view/communicating-data-with/9781449372019/ch01.html)
+
+## [Post-Lecture Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/31)
+
+סקור את מה שלמדת זה עתה עם המבחן שלאחר ההרצאה למעלה!
+
+## משימה
+
+[Market Research](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/4-Data-Science-Lifecycle/16-communication/assignment.md b/translations/he/4-Data-Science-Lifecycle/16-communication/assignment.md
new file mode 100644
index 00000000..540f5da7
--- /dev/null
+++ b/translations/he/4-Data-Science-Lifecycle/16-communication/assignment.md
@@ -0,0 +1,26 @@
+
+# ספר סיפור
+
+## הוראות
+
+מדע הנתונים עוסק כולו בסיפור סיפורים. בחר כל מערך נתונים וכתוב מאמר קצר על סיפור שתוכל לספר עליו. מה אתה מקווה שמערך הנתונים שלך יחשוף? מה תעשה אם הגילויים שלו יתגלו כבעייתיים? מה אם הנתונים שלך לא יחשפו את סודותיהם בקלות? חשוב על התרחישים שמערך הנתונים שלך עשוי להציג וכתוב אותם.
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | -- |
+
+מאמר בן עמוד אחד מוצג בפורמט .doc עם הסבר, תיעוד, קרדיט, וסיפור קוהרנטי מוצג עליו עם דוגמאות מפורטות מהנתונים.| מאמר קצר יותר מוצג בפורמט פחות מפורט | המאמר חסר באחד מהפרטים הנ"ל.
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/4-Data-Science-Lifecycle/README.md b/translations/he/4-Data-Science-Lifecycle/README.md
new file mode 100644
index 00000000..cb221289
--- /dev/null
+++ b/translations/he/4-Data-Science-Lifecycle/README.md
@@ -0,0 +1,30 @@
+
+# מחזור החיים של מדע הנתונים
+
+
+> צילום על ידי Headway ב-Unsplash
+
+בשיעורים אלו, תחקור כמה מההיבטים של מחזור החיים של מדע הנתונים, כולל ניתוח ותקשורת סביב נתונים.
+
+### נושאים
+
+1. [מבוא](14-Introduction/README.md)
+2. [ניתוח](15-analyzing/README.md)
+3. [תקשורת](16-communication/README.md)
+
+### קרדיטים
+
+השיעורים האלו נכתבו באהבה על ידי [Jalen McGee](https://twitter.com/JalenMCG) ו-[Jasmine Greenaway](https://twitter.com/paladique)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/5-Data-Science-In-Cloud/17-Introduction/README.md b/translations/he/5-Data-Science-In-Cloud/17-Introduction/README.md
new file mode 100644
index 00000000..e4008d2a
--- /dev/null
+++ b/translations/he/5-Data-Science-In-Cloud/17-Introduction/README.md
@@ -0,0 +1,114 @@
+
+# מבוא למדעי הנתונים בענן
+
+| ](../../sketchnotes/17-DataScience-Cloud.png)|
+|:---:|
+| מדעי הנתונים בענן: מבוא - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+בשיעור זה תלמדו את העקרונות הבסיסיים של הענן, תבינו מדוע כדאי להשתמש בשירותי ענן לפרויקטים של מדעי הנתונים, ונבחן כמה דוגמאות לפרויקטים של מדעי הנתונים שמתבצעים בענן.
+
+## [שאלון לפני ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/32)
+
+## מהו הענן?
+
+הענן, או מחשוב ענן, הוא אספקת מגוון רחב של שירותי מחשוב בתשלום לפי שימוש, המתארחים על תשתית דרך האינטרנט. השירותים כוללים פתרונות כמו אחסון, מסדי נתונים, רשתות, תוכנה, אנליטיקה ושירותים חכמים.
+
+נהוג להבחין בין ענן ציבורי, ענן פרטי וענן היברידי באופן הבא:
+
+* **ענן ציבורי**: ענן ציבורי הוא בבעלות ומופעל על ידי ספק שירותי ענן צד שלישי, המספק את משאבי המחשוב שלו דרך האינטרנט לציבור הרחב.
+* **ענן פרטי**: מתייחס למשאבי מחשוב ענן המשמשים באופן בלעדי עסק או ארגון יחיד, עם שירותים ותשתית המתוחזקים ברשת פרטית.
+* **ענן היברידי**: מערכת המשלבת בין עננים ציבוריים ופרטיים. משתמשים בוחרים מרכז נתונים מקומי, תוך אפשרות להריץ נתונים ויישומים על עננים ציבוריים.
+
+רוב שירותי מחשוב הענן מתחלקים לשלוש קטגוריות: תשתית כשירות (IaaS), פלטפורמה כשירות (PaaS) ותוכנה כשירות (SaaS).
+
+* **תשתית כשירות (IaaS)**: משתמשים שוכרים תשתית IT כמו שרתים, מכונות וירטואליות (VMs), אחסון, רשתות ומערכות הפעלה.
+* **פלטפורמה כשירות (PaaS)**: משתמשים שוכרים סביבה לפיתוח, בדיקה, אספקה וניהול של יישומי תוכנה. אין צורך לדאוג להקמת או ניהול התשתית הבסיסית.
+* **תוכנה כשירות (SaaS)**: משתמשים מקבלים גישה ליישומי תוכנה דרך האינטרנט, לפי דרישה ובדרך כלל במנוי. אין צורך לדאוג לאירוח, ניהול או תחזוקת היישום.
+
+חלק מספקי הענן הגדולים ביותר הם Amazon Web Services, Google Cloud Platform ו-Microsoft Azure.
+
+## למה לבחור בענן עבור מדעי הנתונים?
+
+מפתחים ואנשי IT בוחרים לעבוד עם הענן ממספר סיבות, כולל:
+
+* **חדשנות**: ניתן לשלב שירותים חדשניים שפותחו על ידי ספקי הענן ישירות ביישומים שלכם.
+* **גמישות**: משלמים רק על השירותים הנדרשים וניתן לבחור מתוך מגוון רחב של שירותים. התשלום הוא לפי שימוש, וניתן להתאים את השירותים לצרכים המשתנים.
+* **תקציב**: אין צורך בהשקעות ראשוניות ברכישת חומרה ותוכנה, הקמת מרכזי נתונים מקומיים ותפעולם. משלמים רק על מה שמשתמשים.
+* **יכולת הרחבה**: המשאבים יכולים להתרחב או להצטמצם בהתאם לצרכי הפרויקט, כך שהיישומים יכולים להשתמש ביותר או פחות כוח מחשוב, אחסון ורוחב פס בהתאם לצרכים.
+* **פרודוקטיביות**: ניתן להתמקד בעסק במקום לבזבז זמן על משימות שניתן לנהל על ידי אחרים, כמו ניהול מרכזי נתונים.
+* **אמינות**: מחשוב ענן מציע דרכים רבות לגיבוי מתמשך של הנתונים, וניתן להגדיר תוכניות התאוששות מאסון כדי לשמור על פעילות העסק והשירותים גם בזמני משבר.
+* **אבטחה**: ניתן ליהנות ממדיניות, טכנולוגיות ובקרות שמחזקות את אבטחת הפרויקט.
+
+אלו הן חלק מהסיבות הנפוצות ביותר לבחירה בשירותי ענן. כעת, לאחר שהבנו מהו הענן ומהם היתרונות המרכזיים שלו, נבחן באופן ספציפי יותר את עבודתם של מדעני נתונים ומפתחים העובדים עם נתונים, וכיצד הענן יכול לעזור להם להתמודד עם אתגרים שונים:
+
+* **אחסון כמויות גדולות של נתונים**: במקום לרכוש, לנהל ולהגן על שרתים גדולים, ניתן לאחסן את הנתונים ישירות בענן, עם פתרונות כמו Azure Cosmos DB, Azure SQL Database ו-Azure Data Lake Storage.
+* **ביצוע אינטגרציה של נתונים**: אינטגרציה של נתונים היא חלק חיוני במדעי הנתונים, שמאפשר מעבר מאיסוף נתונים לפעולה. עם שירותי אינטגרציה בענן, ניתן לאסוף, לעבד ולשלב נתונים ממקורות שונים למחסן נתונים אחד, באמצעות Data Factory.
+* **עיבוד נתונים**: עיבוד כמויות גדולות של נתונים דורש כוח מחשוב רב, ולא לכולם יש גישה למכונות חזקות מספיק. לכן, רבים בוחרים להשתמש ישירות בכוח המחשוב העצום של הענן כדי להריץ ולפרוס את הפתרונות שלהם.
+* **שימוש בשירותי אנליטיקה**: שירותי ענן כמו Azure Synapse Analytics, Azure Stream Analytics ו-Azure Databricks עוזרים להפוך נתונים לתובנות שניתן לפעול לפיהן.
+* **שימוש בשירותי למידת מכונה ובינה מלאכותית**: במקום להתחיל מאפס, ניתן להשתמש באלגוריתמים של למידת מכונה שמציע ספק הענן, עם שירותים כמו AzureML. בנוסף, ניתן להשתמש בשירותים קוגניטיביים כמו זיהוי דיבור, המרת טקסט לדיבור, ראייה ממוחשבת ועוד.
+
+## דוגמאות למדעי הנתונים בענן
+
+בואו נהפוך את זה למוחשי יותר על ידי בחינת כמה תרחישים.
+
+### ניתוח בזמן אמת של תחושות במדיה חברתית
+נתחיל בתרחיש נפוץ בקרב מתחילים בלמידת מכונה: ניתוח תחושות במדיה חברתית בזמן אמת.
+
+נניח שאתם מנהלים אתר חדשות ורוצים לנצל נתונים חיים כדי להבין איזה תוכן עשוי לעניין את הקוראים שלכם. כדי לדעת זאת, ניתן לבנות תוכנית שמבצעת ניתוח תחושות בזמן אמת של נתונים מפרסומים בטוויטר, בנושאים הרלוונטיים לקוראים שלכם.
+
+המדדים המרכזיים שתבדקו הם נפח הציוצים בנושאים מסוימים (האשטגים) ותחושות, שנקבעות באמצעות כלים אנליטיים שמבצעים ניתוח תחושות סביב הנושאים שצוינו.
+
+השלבים הנדרשים ליצירת פרויקט זה הם:
+
+* יצירת Event Hub לאיסוף נתונים מטוויטר
+* הגדרת והפעלת אפליקציית לקוח לטוויטר, שתשתמש ב-Streaming APIs של טוויטר
+* יצירת משימת Stream Analytics
+* הגדרת קלט ושאילתה למשימה
+* יצירת יעד פלט והגדרת הפלט של המשימה
+* הפעלת המשימה
+
+לצפייה בתהליך המלא, עיינו ב-[תיעוד](https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?WT.mc_id=academic-77958-bethanycheum&ocid=AID30411099).
+
+### ניתוח מאמרים מדעיים
+ניקח דוגמה נוספת לפרויקט שיצר [דמיטרי סושניקוב](http://soshnikov.com), אחד ממחברי הקורס הזה.
+
+דמיטרי יצר כלי שמנתח מאמרים על COVID. על ידי סקירת פרויקט זה, תוכלו לראות כיצד ליצור כלי שמפיק ידע ממאמרים מדעיים, מספק תובנות ועוזר לחוקרים לנווט באוספים גדולים של מאמרים בצורה יעילה.
+
+השלבים השונים בפרויקט זה כוללים:
+
+* חילוץ ועיבוד מידע עם [Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
+* שימוש ב-[Azure ML](https://azure.microsoft.com/services/machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) לעיבוד מקבילי
+* אחסון ושאילת מידע עם [Cosmos DB](https://azure.microsoft.com/services/cosmos-db?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
+* יצירת לוח מחוונים אינטראקטיבי לחקר ויזואליזציה של נתונים באמצעות Power BI
+
+לצפייה בתהליך המלא, בקרו ב-[הבלוג של דמיטרי](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/).
+
+כפי שניתן לראות, ניתן לנצל שירותי ענן בדרכים רבות לביצוע מדעי נתונים.
+
+## הערת שוליים
+
+מקורות:
+* https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109
+* https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?ocid=AID3041109
+* https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/
+
+## שאלון לאחר ההרצאה
+
+[שאלון לאחר ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/33)
+
+## משימה
+
+[מחקר שוק](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/5-Data-Science-In-Cloud/17-Introduction/assignment.md b/translations/he/5-Data-Science-In-Cloud/17-Introduction/assignment.md
new file mode 100644
index 00000000..65ad4eae
--- /dev/null
+++ b/translations/he/5-Data-Science-In-Cloud/17-Introduction/assignment.md
@@ -0,0 +1,25 @@
+
+# מחקר שוק
+
+## הוראות
+
+בשיעור הזה למדתם שישנם מספר ספקי ענן חשובים. ערכו מחקר שוק כדי לגלות מה כל אחד מהם יכול להציע למדען הנתונים. האם ההצעות דומות? כתבו מסמך שמתאר את ההצעות של שלושה או יותר מספקי הענן הללו.
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | --- |
+מסמך בן עמוד אחד מתאר את ההצעות למדעני נתונים של שלושה ספקי ענן ומבדיל ביניהם. | מסמך קצר יותר מוצג | מסמך מוצג ללא השלמת הניתוח
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/5-Data-Science-In-Cloud/18-Low-Code/README.md b/translations/he/5-Data-Science-In-Cloud/18-Low-Code/README.md
new file mode 100644
index 00000000..20a5bacf
--- /dev/null
+++ b/translations/he/5-Data-Science-In-Cloud/18-Low-Code/README.md
@@ -0,0 +1,355 @@
+
+# מדע הנתונים בענן: הדרך של "קוד מועט/ללא קוד"
+
+| ](../../sketchnotes/18-DataScience-Cloud.png)|
+|:---:|
+| מדע הנתונים בענן: קוד מועט - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+תוכן עניינים:
+
+- [מדע הנתונים בענן: הדרך של "קוד מועט/ללא קוד"](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [שאלון לפני ההרצאה](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [1. מבוא](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [1.1 מהו Azure Machine Learning?](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [1.2 פרויקט חיזוי כשל לבבי:](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [1.3 מערך הנתונים של כשל לבבי:](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2. אימון מודל בקוד מועט/ללא קוד ב-Azure ML Studio](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.1 יצירת סביבת עבודה ב-Azure ML](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.2 משאבי מחשוב](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.2.1 בחירת האפשרויות הנכונות עבור משאבי המחשוב שלך](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.2.2 יצירת אשכול מחשוב](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.3 טעינת מערך הנתונים](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.4 אימון בקוד מועט/ללא קוד עם AutoML](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [3. פריסת מודל בקוד מועט/ללא קוד וצריכת נקודת קצה](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [3.1 פריסת מודל](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [3.2 צריכת נקודת קצה](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [🚀 אתגר](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [שאלון לאחר ההרצאה](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [סקירה ולימוד עצמי](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [מטלה](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+
+## [שאלון לפני ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/34)
+
+## 1. מבוא
+
+### 1.1 מהו Azure Machine Learning?
+
+פלטפורמת הענן Azure כוללת יותר מ-200 מוצרים ושירותי ענן שנועדו לעזור לך להביא פתרונות חדשים לחיים. מדעני נתונים משקיעים מאמצים רבים בחקר ועיבוד מקדים של נתונים, ובניסיון של סוגים שונים של אלגוריתמים לאימון מודלים כדי לייצר מודלים מדויקים. משימות אלו גוזלות זמן רב ולעיתים קרובות מנצלות בצורה לא יעילה חומרת מחשוב יקרה.
+
+[Azure ML](https://docs.microsoft.com/azure/machine-learning/overview-what-is-azure-machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) היא פלטפורמה מבוססת ענן לבניית פתרונות למידת מכונה ותפעולם ב-Azure. היא כוללת מגוון רחב של תכונות ויכולות המסייעות למדעני נתונים להכין נתונים, לאמן מודלים, לפרסם שירותי חיזוי ולנטר את השימוש בהם. החשוב מכל, היא מסייעת להם להגדיל את היעילות על ידי אוטומציה של משימות רבות שגוזלות זמן רב בתהליך אימון המודלים; והיא מאפשרת להם להשתמש במשאבי מחשוב מבוססי ענן שמסוגלים להתמודד עם כמויות גדולות של נתונים תוך חיוב רק בעת השימוש בפועל.
+
+Azure ML מספקת את כל הכלים שמפתחים ומדעני נתונים זקוקים להם עבור תהליכי העבודה של למידת מכונה. כלים אלו כוללים:
+
+- **Azure Machine Learning Studio**: פורטל אינטרנטי ב-Azure Machine Learning המציע אפשרויות קוד מועט/ללא קוד לאימון מודלים, פריסה, אוטומציה, מעקב וניהול נכסים. הסטודיו משתלב עם Azure Machine Learning SDK לחוויית עבודה חלקה.
+- **Jupyter Notebooks**: מאפשרים אבטיפוס מהיר ובדיקת מודלים.
+- **Azure Machine Learning Designer**: מאפשר גרירה ושחרור של מודולים לבניית ניסויים ולאחר מכן פריסת צינורות עבודה בסביבת קוד מועט.
+- **ממשק AutoML**: מבצע אוטומציה של משימות חוזרות בתהליך פיתוח מודלים, ומאפשר בניית מודלים בקנה מידה גבוה, ביעילות ובפרודוקטיביות, תוך שמירה על איכות המודל.
+- **תיוג נתונים**: כלי עזר ללמידת מכונה שמבצע תיוג אוטומטי של נתונים.
+- **הרחבת למידת מכונה ל-Visual Studio Code**: מספקת סביבת פיתוח מלאה לבניית וניהול פרויקטים של למידת מכונה.
+- **CLI ללמידת מכונה**: מספק פקודות לניהול משאבי Azure ML משורת הפקודה.
+- **שילוב עם מסגרות קוד פתוח** כמו PyTorch, TensorFlow, Scikit-learn ועוד רבות אחרות לאימון, פריסה וניהול תהליך למידת המכונה מקצה לקצה.
+- **MLflow**: ספריית קוד פתוח לניהול מחזור החיים של ניסויי למידת מכונה. **MLFlow Tracking** הוא רכיב של MLflow שמבצע רישום ומעקב אחר מדדי האימון ופריטי המודל שלך, ללא תלות בסביבת הניסוי.
+
+### 1.2 פרויקט חיזוי כשל לבבי:
+
+אין ספק שיצירה ובנייה של פרויקטים היא הדרך הטובה ביותר לבחון את הכישורים והידע שלך. בשיעור זה, נחקור שתי דרכים שונות לבניית פרויקט מדע נתונים לחיזוי התקפי כשל לבבי ב-Azure ML Studio, דרך קוד מועט/ללא קוד ודרך Azure ML SDK, כפי שמוצג בתרשים הבא:
+
+
+
+לכל דרך יש יתרונות וחסרונות משלה. הדרך של קוד מועט/ללא קוד קלה יותר להתחלה מכיוון שהיא כוללת אינטראקציה עם ממשק משתמש גרפי (GUI), ללא צורך בידע מוקדם בקוד. שיטה זו מאפשרת בדיקה מהירה של היתכנות הפרויקט ויצירת POC (הוכחת היתכנות). עם זאת, ככל שהפרויקט גדל ויש צורך בהכנה לייצור, לא ניתן ליצור משאבים דרך GUI בלבד. יש צורך באוטומציה תכנותית של כל התהליך, החל מיצירת משאבים ועד לפריסת מודל. כאן נכנס לתמונה הידע בשימוש ב-Azure ML SDK.
+
+| | קוד מועט/ללא קוד | Azure ML SDK |
+|-------------------|------------------|---------------------------|
+| ידע בקוד | לא נדרש | נדרש |
+| זמן פיתוח | מהיר וקל | תלוי במומחיות בקוד |
+| מוכן לייצור | לא | כן |
+
+### 1.3 מערך הנתונים של כשל לבבי:
+
+מחלות לב וכלי דם (CVDs) הן הגורם מספר 1 למוות ברחבי העולם, ומהוות 31% מכלל מקרי המוות. גורמי סיכון סביבתיים והתנהגותיים כמו עישון, תזונה לא בריאה והשמנת יתר, חוסר פעילות גופנית ושימוש מזיק באלכוהול יכולים לשמש כמאפיינים למודלים חיזויים. היכולת להעריך את הסבירות להתפתחות CVD יכולה להיות שימושית מאוד במניעת התקפים אצל אנשים בסיכון גבוה.
+
+ב-Kaggle זמין [מערך נתונים של כשל לבבי](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) שנשתמש בו בפרויקט זה. ניתן להוריד את מערך הנתונים כעת. מדובר במערך נתונים טבלאי עם 13 עמודות (12 מאפיינים ועמודת יעד אחת) ו-299 שורות.
+
+| | שם משתנה | סוג | תיאור | דוגמה |
+|----|---------------------------|----------------|----------------------------------------------------------|-------------------|
+| 1 | age | מספרי | גיל המטופל | 25 |
+| 2 | anaemia | בוליאני | ירידה בתאי דם אדומים או בהמוגלובין | 0 או 1 |
+| 3 | creatinine_phosphokinase | מספרי | רמת אנזים CPK בדם | 542 |
+| 4 | diabetes | בוליאני | האם למטופל יש סוכרת | 0 או 1 |
+| 5 | ejection_fraction | מספרי | אחוז הדם שיוצא מהלב בכל התכווצות | 45 |
+| 6 | high_blood_pressure | בוליאני | האם למטופל יש יתר לחץ דם | 0 או 1 |
+| 7 | platelets | מספרי | טסיות בדם | 149000 |
+| 8 | serum_creatinine | מספרי | רמת קריאטינין בסרום בדם | 0.5 |
+| 9 | serum_sodium | מספרי | רמת נתרן בסרום בדם | jun |
+| 10 | sex | בוליאני | אישה או גבר | 0 או 1 |
+| 11 | smoking | בוליאני | האם המטופל מעשן | 0 או 1 |
+| 12 | time | מספרי | תקופת מעקב (ימים) | 4 |
+|----|---------------------------|----------------|----------------------------------------------------------|-------------------|
+| 21 | DEATH_EVENT [יעד] | בוליאני | האם המטופל נפטר במהלך תקופת המעקב | 0 או 1 |
+
+לאחר שיש לך את מערך הנתונים, נוכל להתחיל את הפרויקט ב-Azure.
+
+## 2. אימון מודל בקוד מועט/ללא קוד ב-Azure ML Studio
+
+### 2.1 יצירת סביבת עבודה ב-Azure ML
+
+כדי לאמן מודל ב-Azure ML, תחילה עליך ליצור סביבת עבודה ב-Azure ML. סביבת העבודה היא המשאב העליון ב-Azure Machine Learning, המספקת מקום מרכזי לעבודה עם כל הפריטים שאתה יוצר בעת השימוש ב-Azure Machine Learning. סביבת העבודה שומרת היסטוריה של כל ריצות האימון, כולל יומנים, מדדים, פלט ותמונת מצב של הסקריפטים שלך. מידע זה משמש לקביעת איזו ריצת אימון מייצרת את המודל הטוב ביותר. [למידע נוסף](https://docs.microsoft.com/azure/machine-learning/concept-workspace?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
+
+מומלץ להשתמש בדפדפן המעודכן ביותר התואם למערכת ההפעלה שלך. הדפדפנים הבאים נתמכים:
+
+- Microsoft Edge (הגרסה החדשה, לא גרסת Microsoft Edge legacy)
+- Safari (גרסה מעודכנת, למק בלבד)
+- Chrome (גרסה מעודכנת)
+- Firefox (גרסה מעודכנת)
+
+כדי להשתמש ב-Azure Machine Learning, צור סביבת עבודה במנוי Azure שלך. לאחר מכן תוכל להשתמש בסביבת עבודה זו לניהול נתונים, משאבי מחשוב, קוד, מודלים ופריטים אחרים הקשורים לעומסי העבודה של למידת המכונה שלך.
+
+> **_הערה:_** המנוי שלך ב-Azure יחויב בסכום קטן עבור אחסון נתונים כל עוד סביבת העבודה של Azure Machine Learning קיימת במנוי שלך, ולכן אנו ממליצים למחוק את סביבת העבודה כאשר אינך משתמש בה יותר.
+
+1. היכנס ל-[פורטל Azure](https://ms.portal.azure.com/) באמצעות האישורים של Microsoft המשויכים למנוי Azure שלך.
+2. בחר **+Create a resource**
+
+ 
+
+ חפש "Machine Learning" ובחר את האריח של Machine Learning.
+
+ 
+
+ לחץ על כפתור "Create".
+
+ 
+
+ מלא את ההגדרות הבאות:
+ - מנוי: המנוי שלך ב-Azure
+ - קבוצת משאבים: צור או בחר קבוצת משאבים
+ - שם סביבת עבודה: הזן שם ייחודי לסביבת העבודה שלך
+ - אזור: בחר את האזור הגיאוגרפי הקרוב אליך
+ - חשבון אחסון: שים לב לחשבון האחסון החדש שיווצר עבור סביבת העבודה שלך
+ - Key vault: שים לב ל-Key Vault החדש שיווצר עבור סביבת העבודה שלך
+ - Application insights: שים לב למשאב Application Insights החדש שיווצר עבור סביבת העבודה שלך
+ - Container registry: אין (אחד ייווצר אוטומטית בפעם הראשונה שתפרוס מודל למיכל)
+
+ 
+
+ - לחץ על "Create + Review" ולאחר מכן על כפתור "Create".
+3. המתן ליצירת סביבת העבודה שלך (זה עשוי לקחת כמה דקות). לאחר מכן עבור אליה בפורטל. תוכל למצוא אותה דרך שירות Azure Machine Learning.
+4. בעמוד "Overview" של סביבת העבודה שלך, הפעל את Azure Machine Learning Studio (או פתח כרטיסייה חדשה בדפדפן ונווט לכתובת https://ml.azure.com), והיכנס ל-Azure Machine Learning Studio באמצעות חשבון Microsoft שלך. אם תתבקש, בחר את המנוי וסביבת העבודה שלך ב-Azure Machine Learning.
+
+
+
+5. ב-Azure Machine Learning Studio, לחץ על סמל ☰ בפינה השמאלית העליונה כדי לצפות בדפים השונים בממשק. תוכל להשתמש בדפים אלו לניהול המשאבים בסביבת העבודה שלך.
+
+
+
+תוכל לנהל את סביבת העבודה שלך באמצעות פורטל Azure, אך עבור מדעני נתונים ומהנדסי תפעול למידת מכונה, Azure Machine Learning Studio מספק ממשק משתמש ממוקד יותר לניהול משאבי סביבת העבודה.
+
+### 2.2 משאבי מחשוב
+
+משאבי מחשוב הם משאבים מבוססי ענן שעליהם ניתן להריץ תהליכי אימון מודלים וחקר נתונים. ישנם ארבעה סוגים של משאבי מחשוב שניתן ליצור:
+
+- **Compute Instances**: תחנות עבודה לפיתוח שמדעני נתונים יכולים להשתמש בהן לעבודה עם נתונים ומודלים. זה כולל יצירת מכונה וירטואלית (VM) והפעלת מופע מחברת. לאחר מכן תוכל לאמן מודל על ידי קריאה לאשכול מחשוב מתוך המחברת.
+- **Compute Clusters**: אשכולות ניתנים להרחבה של מכונות וירטואליות לעיבוד קוד ניסויים לפי דרישה. תזדקק להם בעת אימון מודל. אשכולות מחשוב יכולים גם להשתמש במשאבי GPU או CPU מיוחדים.
+- **Inference Clusters**: יעדי פריסה לשירותי חיזוי המשתמשים במודלים שאומנו.
+- **מחשוב מצורף**: קישורים למשאבי מחשוב קיימים ב-Azure, כמו מכונות וירטואליות או אשכולות Azure Databricks.
+
+#### 2.2.1 בחירת האפשרויות הנכונות עבור משאבי המחשוב שלך
+
+ישנם גורמים מרכזיים שיש לקחת בחשבון בעת יצירת משאב מחשוב, והבחירות הללו יכולות להיות החלטות קריטיות.
+
+**האם אתה זקוק ל-CPU או GPU?**
+
+CPU (יחידת עיבוד מרכזית) היא המעגל האלקטרוני שמבצע הוראות של תוכנית מחשב. GPU (יחידת עיבוד גרפית) הוא מעגל אלקטרוני ייעודי שיכול לבצע קוד הקשור לגרפיקה בקצב גבוה מאוד.
+
+ההבדל העיקרי בין ארכיטקטורת CPU ל-GPU הוא ש-CPU מיועד לטפל במגוון רחב של משימות במהירות (כפי שנמדד במהירות שעון ה-CPU), אך מוגבל בכמות המשימות שיכולות לפעול במקביל. GPUs מיועדים לעיבוד מקבילי ולכן הם טובים יותר למשימות של למידה עמוקה.
+
+| CPU | GPU |
+|-----------------------------------------|-----------------------------|
+| זול יותר | יקר יותר |
+| רמת מקביליות נמוכה יותר | רמת מקביליות גבוהה יותר |
+| איטי יותר באימון מודלים של למידה עמוקה | אופטימלי ללמידה עמוקה |
+
+**גודל האשכול**
+
+אשכולות גדולים יותר יקרים יותר אך יובילו לתגובה מהירה יותר. לכן, אם יש לך זמן אך לא מספיק כסף, כדאי להתחיל עם אשכול קטן. לעומת זאת, אם יש לך כסף אך מעט זמן, כדאי להתחיל עם אשכול גדול יותר.
+
+**גודל VM**
+
+בהתאם למגבלות הזמן והתקציב שלך, תוכל לשנות את גודל ה-RAM, הדיסק, מספר הליבות ומהירות השעון. הגדלת כל הפרמטרים הללו תהיה יקרה יותר, אך תביא לביצועים טובים יותר.
+
+**מופעים ייעודיים או בעדיפות נמוכה?**
+
+מופע בעדיפות נמוכה פירושו שהוא ניתן לקטיעה: למעשה, Microsoft Azure יכולה לקחת את המשאבים הללו ולהקצות אותם למשימה אחרת, ובכך להפריע לעבודה. מופע ייעודי, או לא ניתן לקטיעה, פירושו שהעבודה לעולם לא תופסק ללא רשותך.
+זו עוד שאלה של זמן מול כסף, שכן מופעים ניתנים לקטיעה זולים יותר ממופעים ייעודיים.
+
+#### 2.2.2 יצירת אשכול מחשוב
+
+ב-[Azure ML workspace](https://ml.azure.com/) שיצרנו קודם, עבור אל "מחשוב" ותוכל לראות את משאבי המחשוב השונים שדיברנו עליהם (כלומר מופעי מחשוב, אשכולות מחשוב, אשכולות חיזוי ומחשוב מצורף). עבור הפרויקט הזה, נצטרך אשכול מחשוב לאימון המודל. בסטודיו, לחץ על תפריט "מחשוב", לאחר מכן על לשונית "אשכול מחשוב" ולחץ על כפתור "+ חדש" כדי ליצור אשכול מחשוב.
+
+
+
+1. בחר את האפשרויות שלך: ייעודי מול עדיפות נמוכה, CPU או GPU, גודל VM ומספר ליבות (תוכל לשמור על ההגדרות המוגדרות כברירת מחדל לפרויקט זה).
+2. לחץ על כפתור "הבא".
+
+
+
+3. תן לאשכול שם מחשוב.
+4. בחר את האפשרויות שלך: מספר מינימלי/מקסימלי של צמתים, שניות במצב סרק לפני הקטנה, גישת SSH. שים לב שאם מספר הצמתים המינימלי הוא 0, תחסוך כסף כשהאשכול במצב סרק. שים לב שככל שמספר הצמתים המקסימלי גבוה יותר, כך האימון יהיה קצר יותר. המספר המקסימלי המומלץ של צמתים הוא 3.
+5. לחץ על כפתור "צור". שלב זה עשוי להימשך מספר דקות.
+
+
+
+מעולה! עכשיו כשיש לנו אשכול מחשוב, נצטרך לטעון את הנתונים ל-Azure ML Studio.
+
+### 2.3 טעינת מערך הנתונים
+
+1. ב-[Azure ML workspace](https://ml.azure.com/) שיצרנו קודם, לחץ על "Datasets" בתפריט השמאלי ולחץ על כפתור "+ Create dataset" כדי ליצור מערך נתונים. בחר באפשרות "From local files" ובחר את מערך הנתונים של Kaggle שהורדנו קודם.
+
+ 
+
+2. תן למערך הנתונים שלך שם, סוג ותיאור. לחץ על "הבא". העלה את הנתונים מהקבצים. לחץ על "הבא".
+
+ 
+
+3. בסכימה, שנה את סוג הנתונים ל-Boolean עבור התכונות הבאות: anaemia, diabetes, high blood pressure, sex, smoking, ו-DEATH_EVENT. לחץ על "הבא" ולחץ על "צור".
+
+ 
+
+מעולה! עכשיו כשמערך הנתונים במקום ואשכול המחשוב נוצר, נוכל להתחיל באימון המודל!
+
+### 2.4 אימון ללא קוד/עם מעט קוד באמצעות AutoML
+
+פיתוח מסורתי של מודלים של למידת מכונה דורש משאבים רבים, ידע מקצועי וזמן רב להשוואת מודלים.
+למידת מכונה אוטומטית (AutoML) היא תהליך שמפשט את המשימות החוזרות והזמן הנדרש לפיתוח מודלים. היא מאפשרת למדעני נתונים, אנליסטים ומפתחים לבנות מודלים ביעילות ובמהירות, תוך שמירה על איכות המודל. [למידע נוסף](https://docs.microsoft.com/azure/machine-learning/concept-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
+
+1. ב-[Azure ML workspace](https://ml.azure.com/) שיצרנו קודם, לחץ על "Automated ML" בתפריט השמאלי ובחר את מערך הנתונים שהעלית זה עתה. לחץ על "הבא".
+
+ 
+
+2. הזן שם ניסוי חדש, עמודת יעד (DEATH_EVENT) ואשכול המחשוב שיצרנו. לחץ על "הבא".
+
+ 
+
+3. בחר "Classification" ולחץ על "סיום". שלב זה עשוי להימשך בין 30 דקות לשעה, בהתאם לגודל אשכול המחשוב שלך.
+
+ 
+
+4. לאחר שהריצה הושלמה, לחץ על לשונית "Automated ML", לחץ על הריצה שלך, ולחץ על האלגוריתם בכרטיס "Best model summary".
+
+ 
+
+כאן תוכל לראות תיאור מפורט של המודל הטוב ביותר ש-AutoML יצר. תוכל גם לחקור מודלים אחרים בלשונית "Models". קח כמה דקות לחקור את המודלים בלשונית "Explanations". לאחר שבחרת את המודל שברצונך להשתמש בו (כאן נבחר במודל הטוב ביותר שנבחר על ידי AutoML), נראה כיצד ניתן לפרוס אותו.
+
+## 3. פריסת מודל ללא קוד/עם מעט קוד וצריכת נקודת קצה
+### 3.1 פריסת מודל
+
+ממשק למידת המכונה האוטומטית מאפשר לפרוס את המודל הטוב ביותר כשירות אינטרנט בכמה שלבים פשוטים.
+פריסה היא שילוב המודל כך שיוכל לבצע תחזיות על נתונים חדשים. עבור פרויקט זה, פריסה לשירות אינטרנט פירושה שאפליקציות רפואיות יוכלו להשתמש במודל כדי לבצע תחזיות חיות על סיכון התקף לב של מטופלים.
+
+בתיאור המודל הטוב ביותר, לחץ על כפתור "Deploy".
+
+
+
+15. תן שם, תיאור, סוג מחשוב (Azure Container Instance), הפעל אימות ולחץ על "Deploy". שלב זה עשוי להימשך כ-20 דקות. תהליך הפריסה כולל רישום המודל, יצירת משאבים והגדרתם לשירות האינטרנט. הודעת סטטוס תופיע תחת "Deploy status". לחץ על "רענן" מדי פעם כדי לבדוק את הסטטוס. המודל ייפרס ויפעל כאשר הסטטוס יהיה "Healthy".
+
+
+
+16. לאחר שהמודל נפרס, לחץ על לשונית "Endpoint" ולחץ על נקודת הקצה שפרסת זה עתה. כאן תוכל למצוא את כל הפרטים על נקודת הקצה.
+
+
+
+מדהים! עכשיו כשיש לנו מודל שפורס, נוכל להתחיל בצריכת נקודת הקצה.
+
+### 3.2 צריכת נקודת קצה
+
+לחץ על לשונית "Consume". כאן תוכל למצוא את נקודת הקצה של REST ואת סקריפט הפייתון באפשרות הצריכה. קח זמן לקרוא את קוד הפייתון.
+
+סקריפט זה ניתן להרצה ישירות מהמחשב המקומי שלך ויצרוך את נקודת הקצה.
+
+
+
+קח רגע לבדוק את שתי שורות הקוד הבאות:
+
+```python
+url = 'http://98e3715f-xxxx-xxxx-xxxx-9ec22d57b796.centralus.azurecontainer.io/score'
+api_key = '' # Replace this with the API key for the web service
+```
+משתנה `url` הוא נקודת הקצה של REST שנמצאה בלשונית הצריכה, ומשתנה `api_key` הוא המפתח הראשי שנמצא גם הוא בלשונית הצריכה (רק במקרה שהפעלת אימות). כך הסקריפט יכול לצרוך את נקודת הקצה.
+
+18. בהרצת הסקריפט, תראה את הפלט הבא:
+ ```python
+ b'"{\\"result\\": [true]}"'
+ ```
+זה אומר שהתחזית לכשל לבבי עבור הנתונים שניתנו היא נכונה. זה הגיוני כי אם תסתכל מקרוב על הנתונים שנוצרו אוטומטית בסקריפט, הכל מוגדר ל-0 ו-false כברירת מחדל. תוכל לשנות את הנתונים לדוגמה הבאה:
+
+```python
+data = {
+ "data":
+ [
+ {
+ 'age': "0",
+ 'anaemia': "false",
+ 'creatinine_phosphokinase': "0",
+ 'diabetes': "false",
+ 'ejection_fraction': "0",
+ 'high_blood_pressure': "false",
+ 'platelets': "0",
+ 'serum_creatinine': "0",
+ 'serum_sodium': "0",
+ 'sex': "false",
+ 'smoking': "false",
+ 'time': "0",
+ },
+ {
+ 'age': "60",
+ 'anaemia': "false",
+ 'creatinine_phosphokinase': "500",
+ 'diabetes': "false",
+ 'ejection_fraction': "38",
+ 'high_blood_pressure': "false",
+ 'platelets': "260000",
+ 'serum_creatinine': "1.40",
+ 'serum_sodium': "137",
+ 'sex': "false",
+ 'smoking': "false",
+ 'time': "130",
+ },
+ ],
+}
+```
+הסקריפט יחזיר:
+ ```python
+ b'"{\\"result\\": [true, false]}"'
+ ```
+
+ברכות! צרכת את המודל שפורס ואימנת אותו ב-Azure ML!
+
+> **_הערה:_** לאחר שתסיים את הפרויקט, אל תשכח למחוק את כל המשאבים.
+
+## 🚀 אתגר
+
+בחן מקרוב את ההסברים והפרטים של המודלים המובילים ש-AutoML יצר. נסה להבין מדוע המודל הטוב ביותר טוב יותר מהאחרים. אילו אלגוריתמים הושוו? מה ההבדלים ביניהם? מדוע המודל הטוב ביותר מבצע טוב יותר במקרה זה?
+
+## [שאלון לאחר ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/35)
+
+## סקירה ולמידה עצמית
+
+בשיעור זה למדת כיצד לאמן, לפרוס ולצרוך מודל לחיזוי סיכון לכשל לבבי בצורה ללא קוד/עם מעט קוד בענן. אם עדיין לא עשית זאת, העמק בהסברים של המודלים ש-AutoML יצר ונסה להבין מדוע המודל הטוב ביותר טוב יותר מאחרים.
+
+תוכל להעמיק עוד בלמידת מכונה אוטומטית ללא קוד/עם מעט קוד על ידי קריאת [התיעוד](https://docs.microsoft.com/azure/machine-learning/tutorial-first-experiment-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+
+## משימה
+
+[פרויקט מדעי נתונים ללא קוד/עם מעט קוד ב-Azure ML](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/5-Data-Science-In-Cloud/18-Low-Code/assignment.md b/translations/he/5-Data-Science-In-Cloud/18-Low-Code/assignment.md
new file mode 100644
index 00000000..a7db117d
--- /dev/null
+++ b/translations/he/5-Data-Science-In-Cloud/18-Low-Code/assignment.md
@@ -0,0 +1,25 @@
+
+# פרויקט מדעי נתונים בקוד נמוך/ללא קוד על Azure ML
+
+## הוראות
+
+ראינו כיצד להשתמש בפלטפורמת Azure ML כדי לאמן, לפרוס ולצרוך מודל בצורה של קוד נמוך/ללא קוד. עכשיו חפשו נתונים שתוכלו להשתמש בהם כדי לאמן מודל נוסף, לפרוס אותו ולצרוך אותו. אתם יכולים לחפש מערכי נתונים ב-[Kaggle](https://kaggle.com) וב-[Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+
+## קריטריונים להערכה
+
+| מצטיין | מספק | דורש שיפור |
+|--------|-------|------------|
+|בעת העלאת הנתונים דאגתם לשנות את סוג התכונה אם היה צורך. בנוסף, ניקיתם את הנתונים אם היה צורך. ביצעתם אימון על מערך נתונים באמצעות AutoML, ובדקתם את הסברי המודל. פרסתם את המודל הטוב ביותר והצלחתם לצרוך אותו. | בעת העלאת הנתונים דאגתם לשנות את סוג התכונה אם היה צורך. ביצעתם אימון על מערך נתונים באמצעות AutoML, פרסתם את המודל הטוב ביותר והצלחתם לצרוך אותו. | פרסתם את המודל הטוב ביותר שאומן באמצעות AutoML והצלחתם לצרוך אותו. |
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/5-Data-Science-In-Cloud/19-Azure/README.md b/translations/he/5-Data-Science-In-Cloud/19-Azure/README.md
new file mode 100644
index 00000000..6ef2062e
--- /dev/null
+++ b/translations/he/5-Data-Science-In-Cloud/19-Azure/README.md
@@ -0,0 +1,312 @@
+
+# מדע הנתונים בענן: הדרך של "Azure ML SDK"
+
+| ](../../sketchnotes/19-DataScience-Cloud.png)|
+|:---:|
+| מדע הנתונים בענן: Azure ML SDK - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+תוכן עניינים:
+
+- [מדע הנתונים בענן: הדרך של "Azure ML SDK"](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [שאלון לפני השיעור](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [1. מבוא](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [1.1 מהו Azure ML SDK?](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [1.2 פרויקט חיזוי אי-ספיקת לב והיכרות עם מערך הנתונים](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2. אימון מודל עם Azure ML SDK](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.1 יצירת סביבת עבודה של Azure ML](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.2 יצירת מופע מחשוב](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.3 טעינת מערך הנתונים](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.4 יצירת מחברות](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.5 אימון מודל](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.5.1 הגדרת סביבת עבודה, ניסוי, אשכול מחשוב ומערך נתונים](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.5.2 הגדרת AutoML ואימון](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [3. פריסת מודל וצריכת נקודת קצה עם Azure ML SDK](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [3.1 שמירת המודל הטוב ביותר](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [3.2 פריסת מודל](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [3.3 צריכת נקודת קצה](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [🚀 אתגר](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [שאלון לאחר השיעור](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [סקירה ולימוד עצמי](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [משימה](../../../../5-Data-Science-In-Cloud/19-Azure)
+
+## [שאלון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/36)
+
+## 1. מבוא
+
+### 1.1 מהו Azure ML SDK?
+
+מדעני נתונים ומפתחים בתחום הבינה המלאכותית משתמשים ב-Azure Machine Learning SDK כדי לבנות ולהפעיל תהליכי עבודה של למידת מכונה עם שירות Azure Machine Learning. ניתן לעבוד עם השירות בכל סביבה של Python, כולל Jupyter Notebooks, Visual Studio Code או סביבת הפיתוח המועדפת עליכם.
+
+תחומים מרכזיים ב-SDK כוללים:
+
+- חקר, הכנה וניהול מחזור החיים של מערכי הנתונים המשמשים בניסויי למידת מכונה.
+- ניהול משאבי ענן לצורך ניטור, רישום וארגון ניסויי למידת מכונה.
+- אימון מודלים באופן מקומי או באמצעות משאבי ענן, כולל אימון מודלים מואץ על ידי GPU.
+- שימוש בלמידת מכונה אוטומטית, שמקבלת פרמטרי תצורה ונתוני אימון. היא מבצעת באופן אוטומטי איטרציות על אלגוריתמים והגדרות היפר-פרמטרים כדי למצוא את המודל הטוב ביותר לחיזוי.
+- פריסת שירותי אינטרנט כדי להפוך את המודלים המאומנים לשירותי RESTful שניתן לצרוך בכל אפליקציה.
+
+[למידע נוסף על Azure Machine Learning SDK](https://docs.microsoft.com/python/api/overview/azure/ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
+
+בשיעור הקודם [כאן](../18-Low-Code/README.md), ראינו כיצד לאמן, לפרוס ולצרוך מודל בצורה של קוד מועט/ללא קוד. השתמשנו במערך הנתונים של אי-ספיקת לב כדי ליצור מודל חיזוי. בשיעור זה, נעשה את אותו הדבר אך באמצעות Azure Machine Learning SDK.
+
+
+
+### 1.2 פרויקט חיזוי אי-ספיקת לב והיכרות עם מערך הנתונים
+
+בדקו [כאן](../18-Low-Code/README.md) את ההיכרות עם פרויקט חיזוי אי-ספיקת לב ומערך הנתונים.
+
+## 2. אימון מודל עם Azure ML SDK
+### 2.1 יצירת סביבת עבודה של Azure ML
+
+לשם פשטות, נעבוד על מחברת Jupyter. זה אומר שכבר יש לכם סביבת עבודה ומופע מחשוב. אם כבר יש לכם סביבת עבודה, תוכלו לדלג ישירות לסעיף 2.3 יצירת מחברת.
+
+אם לא, אנא עקבו אחר ההוראות בסעיף **2.1 יצירת סביבת עבודה של Azure ML** בשיעור הקודם [כאן](../18-Low-Code/README.md) כדי ליצור סביבת עבודה.
+
+### 2.2 יצירת מופע מחשוב
+
+בסביבת העבודה של [Azure ML](https://ml.azure.com/) שיצרנו קודם, עברו לתפריט המחשוב ותראו את המשאבים השונים הזמינים.
+
+
+
+בואו ניצור מופע מחשוב כדי להפעיל מחברת Jupyter.
+1. לחצו על הכפתור + חדש.
+2. תנו שם למופע המחשוב שלכם.
+3. בחרו את האפשרויות שלכם: CPU או GPU, גודל VM ומספר ליבות.
+4. לחצו על כפתור יצירה.
+
+מזל טוב, יצרתם מופע מחשוב! נשתמש במופע זה כדי ליצור מחברת בסעיף [יצירת מחברות](../../../../5-Data-Science-In-Cloud/19-Azure).
+
+### 2.3 טעינת מערך הנתונים
+עיינו בשיעור הקודם [כאן](../18-Low-Code/README.md) בסעיף **2.3 טעינת מערך הנתונים** אם עדיין לא העליתם את מערך הנתונים.
+
+### 2.4 יצירת מחברות
+
+> **_הערה:_** לשלב הבא תוכלו ליצור מחברת חדשה מאפס, או להעלות את [המחברת שיצרנו](notebook.ipynb) ל-Azure ML Studio שלכם. כדי להעלות אותה, פשוט לחצו על תפריט "מחברת" והעלו את המחברת.
+
+מחברות הן חלק חשוב מאוד בתהליך מדע הנתונים. ניתן להשתמש בהן לביצוע ניתוח נתונים חקרני (EDA), לקרוא לאשכול מחשוב כדי לאמן מודל, לקרוא לאשכול הסקה כדי לפרוס נקודת קצה.
+
+כדי ליצור מחברת, אנו זקוקים לצומת מחשוב שמפעיל מופע מחברת Jupyter. חזרו לסביבת העבודה של [Azure ML](https://ml.azure.com/) ולחצו על מופעי מחשוב. ברשימת מופעי המחשוב, אתם אמורים לראות את [מופע המחשוב שיצרנו קודם](../../../../5-Data-Science-In-Cloud/19-Azure).
+
+1. בסעיף האפליקציות, לחצו על האפשרות Jupyter.
+2. סמנו את התיבה "כן, אני מבין" ולחצו על כפתור המשך.
+
+3. זה אמור לפתוח לשונית דפדפן חדשה עם מופע מחברת Jupyter שלכם כפי שמוצג. לחצו על הכפתור "חדש" כדי ליצור מחברת.
+
+
+
+עכשיו שיש לנו מחברת, נוכל להתחיל לאמן את המודל עם Azure ML SDK.
+
+### 2.5 אימון מודל
+
+ראשית, אם יש לכם ספק כלשהו, עיינו בתיעוד של [Azure ML SDK](https://docs.microsoft.com/python/api/overview/azure/ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109). הוא מכיל את כל המידע הדרוש להבנת המודולים שנראה בשיעור זה.
+
+#### 2.5.1 הגדרת סביבת עבודה, ניסוי, אשכול מחשוב ומערך נתונים
+
+עליכם לטעון את `workspace` מקובץ התצורה באמצעות הקוד הבא:
+
+```python
+from azureml.core import Workspace
+ws = Workspace.from_config()
+```
+
+זה מחזיר אובייקט מסוג `Workspace` שמייצג את סביבת העבודה. לאחר מכן עליכם ליצור `experiment` באמצעות הקוד הבא:
+
+```python
+from azureml.core import Experiment
+experiment_name = 'aml-experiment'
+experiment = Experiment(ws, experiment_name)
+```
+כדי לקבל או ליצור ניסוי מסביבת עבודה, מבקשים את הניסוי באמצעות שם הניסוי. שם הניסוי חייב להיות באורך של 3-36 תווים, להתחיל באות או מספר, ויכול להכיל רק אותיות, מספרים, קווים תחתונים ומקפים. אם הניסוי לא נמצא בסביבת העבודה, נוצר ניסוי חדש.
+
+כעת עליכם ליצור אשכול מחשוב לאימון באמצעות הקוד הבא. שימו לב ששלב זה עשוי לקחת מספר דקות.
+
+```python
+from azureml.core.compute import AmlCompute
+
+aml_name = "heart-f-cluster"
+try:
+ aml_compute = AmlCompute(ws, aml_name)
+ print('Found existing AML compute context.')
+except:
+ print('Creating new AML compute context.')
+ aml_config = AmlCompute.provisioning_configuration(vm_size = "Standard_D2_v2", min_nodes=1, max_nodes=3)
+ aml_compute = AmlCompute.create(ws, name = aml_name, provisioning_configuration = aml_config)
+ aml_compute.wait_for_completion(show_output = True)
+
+cts = ws.compute_targets
+compute_target = cts[aml_name]
+```
+
+ניתן לקבל את מערך הנתונים מסביבת העבודה באמצעות שם מערך הנתונים בדרך הבאה:
+
+```python
+dataset = ws.datasets['heart-failure-records']
+df = dataset.to_pandas_dataframe()
+df.describe()
+```
+#### 2.5.2 הגדרת AutoML ואימון
+
+כדי להגדיר את תצורת AutoML, השתמשו במחלקה [AutoMLConfig](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.automlconfig(class)?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+
+כפי שמתואר בתיעוד, ישנם פרמטרים רבים שניתן לשחק איתם. עבור פרויקט זה, נשתמש בפרמטרים הבאים:
+
+- `experiment_timeout_minutes`: הזמן המרבי (בדקות) שבו הניסוי יכול לפעול לפני שהוא נעצר אוטומטית והתוצאות נעשות זמינות.
+- `max_concurrent_iterations`: מספר האיטרציות המרבי של אימון מקביל המותר לניסוי.
+- `primary_metric`: המדד הראשי המשמש לקביעת מצב הניסוי.
+- `compute_target`: יעד המחשוב של Azure Machine Learning שבו יפעל ניסוי למידת המכונה האוטומטי.
+- `task`: סוג המשימה שיש להפעיל. ערכים יכולים להיות 'classification', 'regression', או 'forecasting' בהתאם לסוג בעיית ה-ML האוטומטית שיש לפתור.
+- `training_data`: נתוני האימון שישמשו בתוך הניסוי. עליו להכיל גם תכונות אימון וגם עמודת תווית (אופציונלית עמודת משקל דגימה).
+- `label_column_name`: שם עמודת התווית.
+- `path`: הנתיב המלא לתיקיית פרויקט Azure Machine Learning.
+- `enable_early_stopping`: האם לאפשר סיום מוקדם אם הציון לא משתפר בטווח הקצר.
+- `featurization`: אינדיקטור האם יש לבצע שלב פיצ'ור באופן אוטומטי או לא, או האם יש להשתמש בפיצ'ור מותאם אישית.
+- `debug_log`: קובץ היומן לכתיבת מידע דיבוג.
+
+```python
+from azureml.train.automl import AutoMLConfig
+
+project_folder = './aml-project'
+
+automl_settings = {
+ "experiment_timeout_minutes": 20,
+ "max_concurrent_iterations": 3,
+ "primary_metric" : 'AUC_weighted'
+}
+
+automl_config = AutoMLConfig(compute_target=compute_target,
+ task = "classification",
+ training_data=dataset,
+ label_column_name="DEATH_EVENT",
+ path = project_folder,
+ enable_early_stopping= True,
+ featurization= 'auto',
+ debug_log = "automl_errors.log",
+ **automl_settings
+ )
+```
+כעת, לאחר שהגדרתם את התצורה, תוכלו לאמן את המודל באמצעות הקוד הבא. שלב זה עשוי לקחת עד שעה בהתאם לגודל האשכול שלכם.
+
+```python
+remote_run = experiment.submit(automl_config)
+```
+ניתן להפעיל את הווידג'ט RunDetails כדי להציג את הניסויים השונים.
+```python
+from azureml.widgets import RunDetails
+RunDetails(remote_run).show()
+```
+## 3. פריסת מודל וצריכת נקודת קצה עם Azure ML SDK
+
+### 3.1 שמירת המודל הטוב ביותר
+
+ה-`remote_run` הוא אובייקט מסוג [AutoMLRun](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.run.automlrun?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109). אובייקט זה מכיל את השיטה `get_output()` שמחזירה את הריצה הטובה ביותר ואת המודל המתאים.
+
+```python
+best_run, fitted_model = remote_run.get_output()
+```
+ניתן לראות את הפרמטרים ששימשו למודל הטוב ביותר על ידי פשוט להדפיס את ה-fitted_model ולראות את המאפיינים של המודל הטוב ביותר באמצעות השיטה [get_properties()](https://docs.microsoft.com/python/api/azureml-core/azureml.core.run(class)?view=azure-ml-py#azureml_core_Run_get_properties?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+
+```python
+best_run.get_properties()
+```
+
+כעת רשמו את המודל באמצעות השיטה [register_model](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.run.automlrun?view=azure-ml-py#register-model-model-name-none--description-none--tags-none--iteration-none--metric-none-?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+```python
+model_name = best_run.properties['model_name']
+script_file_name = 'inference/score.py'
+best_run.download_file('outputs/scoring_file_v_1_0_0.py', 'inference/score.py')
+description = "aml heart failure project sdk"
+model = best_run.register_model(model_name = model_name,
+ model_path = './outputs/',
+ description = description,
+ tags = None)
+```
+### 3.2 פריסת מודל
+
+לאחר שמירת המודל הטוב ביותר, ניתן לפרוס אותו באמצעות המחלקה [InferenceConfig](https://docs.microsoft.com/python/api/azureml-core/azureml.core.model.inferenceconfig?view=azure-ml-py?ocid=AID3041109). InferenceConfig מייצגת את הגדרות התצורה לסביבה מותאמת אישית המשמשת לפריסה. המחלקה [AciWebservice](https://docs.microsoft.com/python/api/azureml-core/azureml.core.webservice.aciwebservice?view=azure-ml-py) מייצגת מודל למידת מכונה שפורס כנקודת קצה שירות אינטרנט על Azure Container Instances. שירות האינטרנט המתקבל הוא נקודת קצה HTTP מאוזנת עומסים עם API REST. ניתן לשלוח נתונים ל-API זה ולקבל את החיזוי שהמודל מחזיר.
+
+המודל נפרס באמצעות השיטה [deploy](https://docs.microsoft.com/python/api/azureml-core/azureml.core.model(class)?view=azure-ml-py#deploy-workspace--name--models--inference-config-none--deployment-config-none--deployment-target-none--overwrite-false--show-output-false-?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+
+```python
+from azureml.core.model import InferenceConfig, Model
+from azureml.core.webservice import AciWebservice
+
+inference_config = InferenceConfig(entry_script=script_file_name, environment=best_run.get_environment())
+
+aciconfig = AciWebservice.deploy_configuration(cpu_cores = 1,
+ memory_gb = 1,
+ tags = {'type': "automl-heart-failure-prediction"},
+ description = 'Sample service for AutoML Heart Failure Prediction')
+
+aci_service_name = 'automl-hf-sdk'
+aci_service = Model.deploy(ws, aci_service_name, [model], inference_config, aciconfig)
+aci_service.wait_for_deployment(True)
+print(aci_service.state)
+```
+שלב זה עשוי לקחת מספר דקות.
+
+### 3.3 צריכת נקודת קצה
+
+ניתן לצרוך את נקודת הקצה על ידי יצירת קלט לדוגמה:
+
+```python
+data = {
+ "data":
+ [
+ {
+ 'age': "60",
+ 'anaemia': "false",
+ 'creatinine_phosphokinase': "500",
+ 'diabetes': "false",
+ 'ejection_fraction': "38",
+ 'high_blood_pressure': "false",
+ 'platelets': "260000",
+ 'serum_creatinine': "1.40",
+ 'serum_sodium': "137",
+ 'sex': "false",
+ 'smoking': "false",
+ 'time': "130",
+ },
+ ],
+}
+
+test_sample = str.encode(json.dumps(data))
+```
+ולאחר מכן לשלוח קלט זה למודל שלכם לצורך חיזוי:
+```python
+response = aci_service.run(input_data=test_sample)
+response
+```
+זה אמור להחזיר `'{"result": [false]}'`. המשמעות היא שהקלט של המטופל ששלחנו לנקודת הקצה יצר את התחזית `false`, כלומר, לא סביר שאדם זה יסבול מהתקף לב.
+
+מזל טוב! הרגע השתמשת במודל שפורסם ואומן ב-Azure ML באמצעות Azure ML SDK!
+
+> **_NOTE:_** לאחר שתסיים את הפרויקט, אל תשכח למחוק את כל המשאבים.
+
+## 🚀 אתגר
+
+יש עוד הרבה דברים שניתן לעשות באמצעות ה-SDK, אך לצערנו, לא נוכל לעבור על כולם בשיעור הזה. החדשות הטובות הן שלמידה כיצד לעיין בתיעוד של ה-SDK יכולה לקחת אותך רחוק מאוד בעצמך. עיין בתיעוד של Azure ML SDK ומצא את המחלקה `Pipeline`, שמאפשרת לך ליצור צינורות עבודה. צינור עבודה הוא אוסף של שלבים שניתן להריץ כתהליך עבודה.
+
+**רמז:** עבור אל [תיעוד ה-SDK](https://docs.microsoft.com/python/api/overview/azure/ml/?view=azure-ml-py?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) והקלד מילות מפתח כמו "Pipeline" בשורת החיפוש. עליך למצוא את המחלקה `azureml.pipeline.core.Pipeline` בתוצאות החיפוש.
+
+## [שאלון לאחר השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/37)
+
+## סקירה ולמידה עצמית
+
+בשיעור זה למדת כיצד לאמן, לפרסם ולהשתמש במודל לחיזוי סיכון לאי ספיקת לב באמצעות Azure ML SDK בענן. עיין ב-[תיעוד הזה](https://docs.microsoft.com/python/api/overview/azure/ml/?view=azure-ml-py?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) למידע נוסף על Azure ML SDK. נסה ליצור מודל משלך באמצעות Azure ML SDK.
+
+## משימה
+
+[פרויקט מדעי נתונים באמצעות Azure ML SDK](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לאי-הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/5-Data-Science-In-Cloud/19-Azure/assignment.md b/translations/he/5-Data-Science-In-Cloud/19-Azure/assignment.md
new file mode 100644
index 00000000..634fd7e8
--- /dev/null
+++ b/translations/he/5-Data-Science-In-Cloud/19-Azure/assignment.md
@@ -0,0 +1,25 @@
+
+# פרויקט מדע נתונים באמצעות Azure ML SDK
+
+## הוראות
+
+ראינו כיצד להשתמש בפלטפורמת Azure ML כדי לאמן, לפרוס ולצרוך מודל באמצעות Azure ML SDK. כעת חפשו נתונים שתוכלו להשתמש בהם כדי לאמן מודל נוסף, לפרוס אותו ולצרוך אותו. תוכלו לחפש מערכי נתונים ב-[Kaggle](https://kaggle.com) וב-[Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+
+## קריטריונים להערכה
+
+| מצטיין | מספק | דורש שיפור |
+|--------|-------|------------|
+|בעת ביצוע תצורת AutoML, עיינתם בתיעוד ה-SDK כדי לבדוק אילו פרמטרים ניתן להשתמש. הרצתם אימון על מערך נתונים באמצעות AutoML עם Azure ML SDK, ובדקתם את ההסברים של המודל. פרסתם את המודל הטוב ביותר והצלחתם לצרוך אותו באמצעות Azure ML SDK. | הרצתם אימון על מערך נתונים באמצעות AutoML עם Azure ML SDK, ובדקתם את ההסברים של המודל. פרסתם את המודל הטוב ביותר והצלחתם לצרוך אותו באמצעות Azure ML SDK. | הרצתם אימון על מערך נתונים באמצעות AutoML עם Azure ML SDK. פרסתם את המודל הטוב ביותר והצלחתם לצרוך אותו באמצעות Azure ML SDK. |
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/5-Data-Science-In-Cloud/README.md b/translations/he/5-Data-Science-In-Cloud/README.md
new file mode 100644
index 00000000..5ab3aee6
--- /dev/null
+++ b/translations/he/5-Data-Science-In-Cloud/README.md
@@ -0,0 +1,35 @@
+
+# מדע הנתונים בענן
+
+
+
+> צילום מאת [Jelleke Vanooteghem](https://unsplash.com/@ilumire) מתוך [Unsplash](https://unsplash.com/s/photos/cloud?orientation=landscape)
+
+כשמדובר בביצוע מדע נתונים עם נתונים גדולים, הענן יכול להיות משנה משחק. בשלושת השיעורים הבאים, נלמד מהו הענן ומדוע הוא יכול להיות מאוד מועיל. בנוסף, נחקור מערך נתונים על אי ספיקת לב ונבנה מודל שיעזור להעריך את ההסתברות של אדם לסבול מאי ספיקת לב. נשתמש בכוחו של הענן כדי לאמן, לפרוס ולצרוך מודל בשתי דרכים שונות. דרך אחת תשתמש רק בממשק המשתמש בגישה של Low code/No code, והדרך השנייה תשתמש ב-Azure Machine Learning Software Developer Kit (Azure ML SDK).
+
+
+
+### נושאים
+
+1. [למה להשתמש בענן עבור מדע נתונים?](17-Introduction/README.md)
+2. [מדע הנתונים בענן: הדרך של "Low code/No code"](18-Low-Code/README.md)
+3. [מדע הנתונים בענן: הדרך של "Azure ML SDK"](19-Azure/README.md)
+
+### קרדיטים
+השיעורים נכתבו עם ☁️ ו-💕 על ידי [Maud Levy](https://twitter.com/maudstweets) ו-[Tiffany Souterre](https://twitter.com/TiffanySouterre)
+
+הנתונים עבור פרויקט חיזוי אי ספיקת לב נלקחו מ[
+Larxel](https://www.kaggle.com/andrewmvd) ב-[Kaggle](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data). הנתונים מורשים תחת [Attribution 4.0 International (CC BY 4.0)](https://creativecommons.org/licenses/by/4.0/).
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור סמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו נושאים באחריות לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/he/6-Data-Science-In-Wild/20-Real-World-Examples/README.md
new file mode 100644
index 00000000..ba8a8587
--- /dev/null
+++ b/translations/he/6-Data-Science-In-Wild/20-Real-World-Examples/README.md
@@ -0,0 +1,155 @@
+
+# מדע הנתונים בעולם האמיתי
+
+|  ](../../sketchnotes/20-DataScience-RealWorld.png) |
+| :--------------------------------------------------------------------------------------------------------------: |
+| מדע הנתונים בעולם האמיתי - _איור מאת [@nitya](https://twitter.com/nitya)_ |
+
+אנחנו כמעט בסוף המסע הלימודי הזה!
+
+התחלנו עם הגדרות של מדע הנתונים ואתיקה, חקרנו כלים וטכניקות שונות לניתוח ויזואליזציה של נתונים, סקרנו את מחזור החיים של מדע הנתונים, ובחנו כיצד להרחיב ולייעל תהליכי עבודה במדע הנתונים באמצעות שירותי מחשוב ענן. אז אתם בטח שואלים את עצמכם: _"איך בדיוק אני מחבר את כל מה שלמדתי להקשרים בעולם האמיתי?"_
+
+בשיעור הזה, נחקור יישומים של מדע הנתונים בתעשייה ונצלול לדוגמאות ספציפיות בתחומי המחקר, מדעי הרוח הדיגיטליים וקיימות. נבחן הזדמנויות לפרויקטים לסטודנטים ונסיים עם משאבים שימושיים שיעזרו לכם להמשיך את מסע הלמידה שלכם!
+
+## חידון לפני השיעור
+
+[חידון לפני השיעור](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/38)
+
+## מדע הנתונים + תעשייה
+
+בזכות הדמוקרטיזציה של הבינה המלאכותית, מפתחים מוצאים כיום שקל יותר לעצב ולשלב תובנות מבוססות נתונים והחלטות מונעות בינה מלאכותית בחוויות משתמש ותהליכי פיתוח. הנה כמה דוגמאות ליישומים של מדע הנתונים בעולם האמיתי בתעשייה:
+
+ * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) השתמש במדע הנתונים כדי לקשר בין מונחי חיפוש למגמות שפעת. למרות שהגישה הייתה פגומה, היא העלתה את המודעות לאפשרויות (ולאתגרים) של תחזיות בריאות מבוססות נתונים.
+
+ * [תחזיות מסלולים של UPS](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - מסביר כיצד UPS משתמשת במדע הנתונים ולמידת מכונה כדי לחזות מסלולים אופטימליים למשלוחים, תוך התחשבות בתנאי מזג האוויר, דפוסי תנועה, מועדי אספקה ועוד.
+
+ * [ויזואליזציה של מסלולי מוניות בניו יורק](http://chriswhong.github.io/nyctaxi/) - נתונים שנאספו באמצעות [חוקי חופש המידע](https://chriswhong.com/open-data/foil_nyc_taxi/) עזרו להמחיש יום בחיי המוניות בניו יורק, ולעזור לנו להבין כיצד הן מנווטות בעיר העמוסה, כמה כסף הן מרוויחות, ומה משך הנסיעות בכל פרק זמן של 24 שעות.
+
+ * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - משתמש בנתונים (על מיקומי איסוף והורדה, משך נסיעות, מסלולים מועדפים וכו') שנאספים ממיליוני נסיעות יומיות של אובר כדי לבנות כלי ניתוח נתונים המסייע בקביעת מחירים, בטיחות, זיהוי הונאות והחלטות ניווט.
+
+ * [אנליטיקה בספורט](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - מתמקדת ב_אנליטיקה חזויה_ (ניתוח קבוצות ושחקנים - כמו [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - וניהול אוהדים) וב_ויזואליזציה של נתונים_ (לוחות מחוונים לקבוצות ואוהדים, משחקים וכו') עם יישומים כמו גיוס כישרונות, הימורים בספורט וניהול מלאי/אצטדיונים.
+
+ * [מדע הנתונים בבנקאות](https://data-flair.training/blogs/data-science-in-banking/) - מדגיש את הערך של מדע הנתונים בתעשיית הפיננסים עם יישומים הנעים ממודלים של סיכונים וזיהוי הונאות, ועד פילוח לקוחות, תחזיות בזמן אמת ומערכות המלצה. אנליטיקה חזויה גם מניעה מדדים קריטיים כמו [ציוני אשראי](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit).
+
+ * [מדע הנתונים בבריאות](https://data-flair.training/blogs/data-science-in-healthcare/) - מדגיש יישומים כמו הדמיה רפואית (למשל, MRI, רנטגן, CT-Scan), גנומיקה (ריצוף DNA), פיתוח תרופות (הערכת סיכונים, תחזית הצלחה), אנליטיקה חזויה (טיפול בחולים ולוגיסטיקת אספקה), מעקב ומניעת מחלות ועוד.
+
+ קרדיט לתמונה: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/)
+
+התרשים מציג תחומים ודוגמאות נוספים ליישום טכניקות מדע הנתונים. רוצים לחקור יישומים נוספים? עיינו בסעיף [סקירה ולימוד עצמי](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) למטה.
+
+## מדע הנתונים + מחקר
+
+|  ](../../sketchnotes/20-DataScience-Research.png) |
+| :---------------------------------------------------------------------------------------------------------------: |
+| מדע הנתונים ומחקר - _איור מאת [@nitya](https://twitter.com/nitya)_ |
+
+בעוד שיישומים בעולם האמיתי מתמקדים לעיתים קרובות במקרי שימוש בתעשייה בקנה מידה רחב, יישומים ופרויקטים בתחום _המחקר_ יכולים להיות שימושיים משתי פרספקטיבות:
+
+* _הזדמנויות לחדשנות_ - חקר פיתוח מהיר של רעיונות מתקדמים ובדיקת חוויות משתמש ליישומים של הדור הבא.
+* _אתגרי פריסה_ - חקירת נזקים פוטנציאליים או השלכות בלתי צפויות של טכנולוגיות מדע הנתונים בהקשרים בעולם האמיתי.
+
+עבור סטודנטים, פרויקטי מחקר אלו יכולים לספק הזדמנויות ללמידה ושיתוף פעולה, לשפר את ההבנה שלכם בנושא ולהרחיב את המודעות והמעורבות שלכם עם אנשים או צוותים רלוונטיים שעובדים בתחומי עניין. אז איך נראים פרויקטי מחקר וכיצד הם יכולים להשפיע?
+
+בואו נבחן דוגמה אחת - [מחקר Gender Shades של MIT](http://gendershades.org/overview.html) מאת ג'וי בואולמיני (MIT Media Labs) עם [מאמר מחקר מרכזי](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) שנכתב בשיתוף עם טימניט גברו (אז במיקרוסופט מחקר) שהתמקד ב:
+
+ * **מה:** מטרת פרויקט המחקר הייתה _להעריך הטיה קיימת באלגוריתמים ובמאגרי נתונים לניתוח פנים אוטומטי_ בהתבסס על מגדר וגוון עור.
+ * **למה:** ניתוח פנים משמש בתחומים כמו אכיפת חוק, אבטחת שדות תעופה, מערכות גיוס ועוד - הקשרים שבהם סיווגים שגויים (למשל, עקב הטיה) יכולים לגרום לנזקים כלכליים וחברתיים פוטנציאליים לפרטים או קבוצות מושפעות. הבנת ההטיות (והסרתן או הפחתתן) היא מפתח להוגנות בשימוש.
+ * **איך:** החוקרים זיהו שמדדים קיימים השתמשו בעיקר בנבדקים בעלי עור בהיר, ואספו מאגר נתונים חדש (1000+ תמונות) שהיה _מאוזן יותר_ לפי מגדר וגוון עור. מאגר הנתונים שימש להערכת הדיוק של שלושה מוצרים לסיווג מגדר (ממיקרוסופט, IBM ו-Face++).
+
+התוצאות הראו שלמרות שהדיוק הכולל היה טוב, הייתה הבחנה ברורה בשיעורי השגיאות בין תתי קבוצות שונות - עם **שגיאות זיהוי מגדר** גבוהות יותר לנשים או אנשים בעלי גוון עור כהה יותר, מה שמעיד על הטיה.
+
+**תוצאות מרכזיות:** המחקר העלה את המודעות לכך שמדע הנתונים זקוק ל_מאגרי נתונים מייצגים_ יותר (תתי קבוצות מאוזנות) ול_צוותים מגוונים_ יותר (רקע מגוון) כדי לזהות ולהסיר או להפחית הטיות כאלו מוקדם יותר בפתרונות AI. מאמצי מחקר כמו זה גם תורמים להגדרת עקרונות ופרקטיקות ל_בינה מלאכותית אחראית_ בארגונים רבים, לשיפור ההוגנות במוצרים ותהליכים מבוססי AI.
+
+**רוצים ללמוד על מאמצי מחקר רלוונטיים במיקרוסופט?**
+
+* עיינו ב[פרויקטי מחקר של מיקרוסופט](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) בתחום הבינה המלאכותית.
+* חקרו פרויקטים של סטודנטים מ[בית הספר לקיץ במדע הנתונים של מיקרוסופט](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/).
+* עיינו בפרויקט [Fairlearn](https://fairlearn.org/) וביוזמות [בינה מלאכותית אחראית](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6).
+
+## מדע הנתונים + מדעי הרוח
+
+|  ](../../sketchnotes/20-DataScience-Humanities.png) |
+| :---------------------------------------------------------------------------------------------------------------: |
+| מדע הנתונים ומדעי הרוח הדיגיטליים - _איור מאת [@nitya](https://twitter.com/nitya)_ |
+
+מדעי הרוח הדיגיטליים [הוגדרו](https://digitalhumanities.stanford.edu/about-dh-stanford) כ"אוסף של פרקטיקות וגישות המשלבות שיטות חישוביות עם חקירה הומניסטית". [פרויקטים של סטנפורד](https://digitalhumanities.stanford.edu/projects) כמו _"היסטוריה מחדש"_ ו_"חשיבה פואטית"_ מדגימים את הקשר בין [מדעי הרוח הדיגיטליים ומדע הנתונים](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - תוך הדגשת טכניקות כמו ניתוח רשתות, ויזואליזציה של מידע, ניתוח מרחבי וטקסטואלי שיכולים לעזור לנו לבחון מחדש מאגרי נתונים היסטוריים וספרותיים כדי להפיק תובנות חדשות ופרספקטיבות.
+
+*רוצים לחקור ולהרחיב פרויקט בתחום הזה?*
+
+עיינו ב["אמילי דיקינסון ומטר המצב רוח"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - דוגמה נהדרת מ[ג'ן לופר](https://twitter.com/jenlooper) ששואלת כיצד נוכל להשתמש במדע הנתונים כדי לבחון מחדש שירה מוכרת ולהעריך מחדש את משמעותה ואת תרומתה של המחברת בהקשרים חדשים. למשל, _האם נוכל לחזות את העונה שבה נכתבה שירה על ידי ניתוח הטון או הרגש שלה_ - ומה זה אומר על מצב הרוח של המחברת בתקופה הרלוונטית?
+
+כדי לענות על השאלה הזו, אנו עוקבים אחר שלבי מחזור החיים של מדע הנתונים:
+ * [`רכישת נתונים`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - לאסוף מאגר נתונים רלוונטי לניתוח. אפשרויות כוללות שימוש ב-API (למשל, [Poetry DB API](https://poetrydb.org/index.html)) או גרידת דפי אינטרנט (למשל, [פרויקט גוטנברג](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) באמצעות כלים כמו [Scrapy](https://scrapy.org/).
+ * [`ניקוי נתונים`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - מסביר כיצד ניתן לעצב, לנקות ולפשט טקסט באמצעות כלים בסיסיים כמו Visual Studio Code ו-Microsoft Excel.
+ * [`ניתוח נתונים`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - מסביר כיצד ניתן לייבא את מאגר הנתונים ל"מחברות" לניתוח באמצעות חבילות Python (כמו pandas, numpy ו-matplotlib) לארגון וויזואליזציה של הנתונים.
+ * [`ניתוח רגשות`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - מסביר כיצד ניתן לשלב שירותי ענן כמו Text Analytics, באמצעות כלים ללא קוד כמו [Power Automate](https://flow.microsoft.com/en-us/) לתהליכי עיבוד נתונים אוטומטיים.
+
+באמצעות תהליך זה, נוכל לחקור את ההשפעות העונתיות על הרגש בשירים, ולעזור לנו לעצב פרספקטיבות משלנו על המחברת. נסו זאת בעצמכם - ואז הרחיבו את המחברת כדי לשאול שאלות נוספות או להמחיש את הנתונים בדרכים חדשות!
+
+> תוכלו להשתמש בכמה מהכלים ב[ערכת הכלים של מדעי הרוח הדיגיטליים](https://github.com/Digital-Humanities-Toolkit) כדי להמשיך לחקור כיוונים אלו.
+
+## מדע הנתונים + קיימות
+
+|  ](../../sketchnotes/20-DataScience-Sustainability.png) |
+| :---------------------------------------------------------------------------------------------------------------: |
+| מדע הנתונים וקיימות - _איור מאת [@nitya](https://twitter.com/nitya)_ |
+
+[אג'נדה 2030 לפיתוח בר קיימא](https://sdgs.un.org/2030agenda) - שאומצה על ידי כל המדינות החברות באו"ם בשנת 2015 - מזהה 17 יעדים, כולל כאלו שמתמקדים ב**הגנה על כדור הארץ** מפני התדרדרות והשפעות שינויי האקלים. יוזמת [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) תומכת ביעדים אלו על ידי חקר דרכים שבהן פתרונות טכנולוגיים יכולים לתמוך ולבנות עתיד בר קיימא יותר עם [מיקוד ב-4 יעדים](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - להיות שליליים בפחמן, חיוביים במים, ללא פסולת, וביודיוורסיים עד 2030.
+
+התמודדות עם אתגרים אלו בקנה מידה רחב ובזמן דורשת חשיבה בקנה מידה ענני - ונתונים בקנה מידה גדול. יוזמת [המחשב הפלנטרי](https://planetarycomputer.microsoft.com/) מספקת 4 רכיבים שיעזרו למדעני נתונים ומפתחים במאמץ זה:
+
+ * [קטלוג נתונים](https://planetarycomputer.microsoft.com/catalog) - עם פטה-בייטים של נתוני מערכות כדור הארץ (חינמיים ומאוחסנים ב-Azure).
+ * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - כדי לעזור למשתמשים לחפש נתונים רלוונטיים במרחב ובזמן.
+ * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - סביבה מנוהלת למדענים לעיבוד מאגרי נתונים גיאו-מרחביים עצומים.
+ * [יישומים](https://planetarycomputer.microsoft.com/applications) - מציגים מקרי שימוש וכלים לתובנות קיימות.
+**פרויקט המחשב הפלנטרי נמצא כרגע בתצוגה מקדימה (נכון לספטמבר 2021)** - כך תוכלו להתחיל לתרום לפתרונות קיימות באמצעות מדע הנתונים.
+
+* [בקשו גישה](https://planetarycomputer.microsoft.com/account/request) כדי להתחיל לחקור ולהתחבר לעמיתים.
+* [חקור את התיעוד](https://planetarycomputer.microsoft.com/docs/overview/about) כדי להבין אילו מערכי נתונים ו-APIs נתמכים.
+* חקור יישומים כמו [ניטור מערכות אקולוגיות](https://analytics-lab.org/ecosystemmonitoring/) לקבלת השראה לרעיונות ליישומים.
+
+חשבו כיצד תוכלו להשתמש בהדמיית נתונים כדי לחשוף או להעצים תובנות רלוונטיות בתחומים כמו שינויי אקלים וכריתת יערות. או חשבו כיצד ניתן להשתמש בתובנות כדי ליצור חוויות משתמש חדשות שמניעות שינויים התנהגותיים לחיים ברי קיימא יותר.
+
+## מדע הנתונים + סטודנטים
+
+דיברנו על יישומים בעולם האמיתי בתעשייה ובמחקר, וחקרנו דוגמאות ליישומי מדע הנתונים במדעי הרוח הדיגיטליים ובקיימות. אז איך תוכלו לפתח את הכישורים שלכם ולשתף את המומחיות שלכם כמתחילים במדע הנתונים?
+
+הנה כמה דוגמאות לפרויקטים של סטודנטים במדע הנתונים שיכולים להוות השראה עבורכם.
+
+ * [בית הספר לקיץ במדע הנתונים של MSR](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) עם [פרויקטים](https://github.com/msr-ds3) ב-GitHub שחוקרים נושאים כמו:
+ - [הטיה גזעית בשימוש בכוח על ידי המשטרה](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk)
+ - [אמינות מערכת הרכבת התחתית של ניו יורק](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit)
+ * [דיגיטציה של תרבות חומרית: חקר התפלגויות סוציו-אקונומיות בסירקאפ](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - מאת [אורנלה אלטוניאן](https://twitter.com/ornelladotcom) והצוות שלה בקלרמונט, תוך שימוש ב-[ArcGIS StoryMaps](https://storymaps.arcgis.com/).
+
+## 🚀 אתגר
+
+חפשו מאמרים שממליצים על פרויקטים במדע הנתונים שמתאימים למתחילים - כמו [50 תחומי הנושא האלו](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) או [21 רעיונות לפרויקטים](https://www.intellspot.com/data-science-project-ideas) או [16 פרויקטים עם קוד מקור](https://data-flair.training/blogs/data-science-project-ideas/) שתוכלו לפרק ולהרכיב מחדש. ואל תשכחו לכתוב בלוג על מסעות הלמידה שלכם ולשתף את התובנות שלכם איתנו.
+
+## חידון לאחר ההרצאה
+
+[חידון לאחר ההרצאה](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/39)
+
+## סקירה ולימוד עצמי
+
+רוצים לחקור עוד מקרי שימוש? הנה כמה מאמרים רלוונטיים:
+ * [17 יישומים ודוגמאות של מדע הנתונים](https://builtin.com/data-science/data-science-applications-examples) - יולי 2021
+ * [11 יישומים עוצרי נשימה של מדע הנתונים בעולם האמיתי](https://myblindbird.com/data-science-applications-real-world/) - מאי 2021
+ * [מדע הנתונים בעולם האמיתי](https://towardsdatascience.com/data-science-in-the-real-world/home) - אוסף מאמרים
+ * מדע הנתונים ב: [חינוך](https://data-flair.training/blogs/data-science-in-education/), [חקלאות](https://data-flair.training/blogs/data-science-in-agriculture/), [פיננסים](https://data-flair.training/blogs/data-science-in-finance/), [סרטים](https://data-flair.training/blogs/data-science-at-movies/) ועוד.
+
+## משימה
+
+[חקור מערך נתונים של המחשב הפלנטרי](assignment.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md b/translations/he/6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md
new file mode 100644
index 00000000..4c445ced
--- /dev/null
+++ b/translations/he/6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md
@@ -0,0 +1,50 @@
+
+# חקור מערך נתונים של מחשב פלנטרי
+
+## הוראות
+
+בשיעור זה דיברנו על תחומים שונים של יישומי מדע הנתונים - עם התעמקות בדוגמאות הקשורות למחקר, קיימות והומניסטיקה דיגיטלית. במשימה זו, תחקור אחת מהדוגמאות הללו בפירוט רב יותר, ותיישם חלק מהלמידות שלך על ויזואליזציות וניתוח נתונים כדי להפיק תובנות על נתוני קיימות.
+
+לפרויקט [המחשב הפלנטרי](https://planetarycomputer.microsoft.com/) יש מערכי נתונים ו-APIs שניתן לגשת אליהם עם חשבון - בקש חשבון אם ברצונך לנסות את שלב הבונוס במשימה. האתר גם מספק את תכונת [Explorer](https://planetarycomputer.microsoft.com/explore) שניתן להשתמש בה ללא יצירת חשבון.
+
+`שלבים:`
+ממשק ה-Explorer (המוצג בצילום המסך למטה) מאפשר לך לבחור מערך נתונים (מתוך האפשרויות המוצעות), שאילתה מוגדרת מראש (לסינון נתונים) ואפשרות הצגה (ליצירת ויזואליזציה רלוונטית). במשימה זו, עליך:
+
+ 1. לקרוא את [התיעוד של Explorer](https://planetarycomputer.microsoft.com/docs/overview/explorer/) - להבין את האפשרויות.
+ 2. לחקור את [הקטלוג](https://planetarycomputer.microsoft.com/catalog) של מערכי הנתונים - ללמוד את מטרת כל אחד מהם.
+ 3. להשתמש ב-Explorer - לבחור מערך נתונים שמעניין אותך, לבחור שאילתה רלוונטית ואפשרות הצגה מתאימה.
+
+
+
+`המשימה שלך:`
+כעת למד את הוויזואליזציה שמוצגת בדפדפן וענה על השאלות הבאות:
+ * אילו _מאפיינים_ יש למערך הנתונים?
+ * אילו _תובנות_ או תוצאות מספקת הוויזואליזציה?
+ * מהן _המשמעויות_ של התובנות הללו למטרות הקיימות של הפרויקט?
+ * מהן _המגבלות_ של הוויזואליזציה (כלומר, איזו תובנה לא קיבלת)?
+ * אם היית מקבל את הנתונים הגולמיים, אילו _ויזואליזציות חלופיות_ היית יוצר, ולמה?
+
+`נקודות בונוס:`
+הגש בקשה לחשבון - והתחבר לאחר קבלת האישור.
+ * השתמש באפשרות _Launch Hub_ כדי לפתוח את הנתונים הגולמיים במחברת.
+ * חקור את הנתונים באופן אינטראקטיבי, ויישם את הוויזואליזציות החלופיות שחשבת עליהן.
+ * כעת נתח את הוויזואליזציות המותאמות אישית שלך - האם הצלחת להפיק את התובנות שפספסת קודם?
+
+## קריטריונים להערכה
+
+מצטיין | מספק | דורש שיפור
+--- | --- | -- |
+כל חמש השאלות המרכזיות נענו. הסטודנט זיהה בבירור כיצד ויזואליזציות נוכחיות וחלופיות יכולות לספק תובנות על מטרות או תוצאות הקיימות.| הסטודנט ענה לפחות על שלוש השאלות הראשונות בפירוט רב, והראה שהיה לו ניסיון מעשי עם ה-Explorer. | הסטודנט לא ענה על מספר שאלות, או סיפק פרטים לא מספקים - מה שמעיד על כך שלא נעשה ניסיון משמעותי בפרויקט |
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/6-Data-Science-In-Wild/README.md b/translations/he/6-Data-Science-In-Wild/README.md
new file mode 100644
index 00000000..8bd3ef5e
--- /dev/null
+++ b/translations/he/6-Data-Science-In-Wild/README.md
@@ -0,0 +1,25 @@
+
+# מדע הנתונים בשטח
+
+יישומים מעשיים של מדע הנתונים בתעשיות שונות.
+
+### נושאים
+
+1. [מדע הנתונים בעולם האמיתי](20-Real-World-Examples/README.md)
+
+### קרדיטים
+
+נכתב באהבה על ידי [Nitya Narasimhan](https://twitter.com/nitya)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/CODE_OF_CONDUCT.md b/translations/he/CODE_OF_CONDUCT.md
new file mode 100644
index 00000000..2bca04fd
--- /dev/null
+++ b/translations/he/CODE_OF_CONDUCT.md
@@ -0,0 +1,23 @@
+
+# קוד ההתנהגות של קוד פתוח של מיקרוסופט
+
+הפרויקט הזה אימץ את [קוד ההתנהגות של קוד פתוח של מיקרוסופט](https://opensource.microsoft.com/codeofconduct/).
+
+משאבים:
+
+- [קוד ההתנהגות של קוד פתוח של מיקרוסופט](https://opensource.microsoft.com/codeofconduct/)
+- [שאלות נפוצות על קוד ההתנהגות של מיקרוסופט](https://opensource.microsoft.com/codeofconduct/faq/)
+- ניתן ליצור קשר בכתובת [opencode@microsoft.com](mailto:opencode@microsoft.com) לשאלות או חששות
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/CONTRIBUTING.md b/translations/he/CONTRIBUTING.md
new file mode 100644
index 00000000..c3a371f2
--- /dev/null
+++ b/translations/he/CONTRIBUTING.md
@@ -0,0 +1,23 @@
+
+# תרומה
+
+הפרויקט הזה מקבל בברכה תרומות והצעות. רוב התרומות דורשות ממך להסכים להסכם רישיון תורם (CLA) שמצהיר שיש לך את הזכות, ושאתה אכן מעניק לנו את הזכויות להשתמש בתרומתך. לפרטים נוספים, בקר בכתובת https://cla.microsoft.com.
+
+כאשר אתה מגיש בקשת משיכה (pull request), CLA-bot יבדוק באופן אוטומטי אם עליך לספק CLA ויעדכן את הבקשה בהתאם (לדוגמה, תווית, תגובה). פשוט עקוב אחר ההוראות שסופקו על ידי הבוט. תצטרך לעשות זאת רק פעם אחת עבור כל המאגרים שמשתמשים ב-CLA שלנו.
+
+הפרויקט הזה אימץ את [קוד ההתנהגות של קוד פתוח של Microsoft](https://opensource.microsoft.com/codeofconduct/).
+למידע נוסף, ראה את [שאלות נפוצות על קוד ההתנהגות](https://opensource.microsoft.com/codeofconduct/faq/)
+או צור קשר עם [opencode@microsoft.com](mailto:opencode@microsoft.com) לכל שאלה או הערה נוספת.
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/README.md b/translations/he/README.md
new file mode 100644
index 00000000..ea10413e
--- /dev/null
+++ b/translations/he/README.md
@@ -0,0 +1,154 @@
+
+# מדעי הנתונים למתחילים - תוכנית לימודים
+
+Azure Cloud Advocates ב-Microsoft שמחים להציע תוכנית לימודים בת 10 שבועות ו-20 שיעורים בנושא מדעי הנתונים. כל שיעור כולל מבחנים לפני ואחרי השיעור, הוראות כתובות להשלמת השיעור, פתרון ומשימה. הגישה שלנו מבוססת פרויקטים ומאפשרת ללמוד תוך כדי בנייה, שיטה מוכחת להטמעת מיומנויות חדשות.
+
+**תודה רבה למחברים שלנו:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer).
+
+**🙏 תודה מיוחדת 🙏 ל-[Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) המחברים, הסוקרים ותורמי התוכן שלנו,** במיוחד Aaryan Arora, [Aditya Garg](https://github.com/AdityaGarg00), [Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/), [Ankita Singh](https://www.linkedin.com/in/ankitasingh007), [Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/), [Arpita Das](https://www.linkedin.com/in/arpitadas01/), ChhailBihari Dubey, [Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor), [Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [Majd Safi](https://www.linkedin.com/in/majd-s/), [Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/), [Miguel Correa](https://www.linkedin.com/in/miguelmque/), [Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119), [Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum), [Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/), [Rohit Yadav](https://www.linkedin.com/in/rty2423), Samridhi Sharma, [Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200), [Sheena Narula](https://www.linkedin.com/in/sheena-narua-n/), [Tauqeer Ahmad](https://www.linkedin.com/in/tauqeerahmad5201/), Yogendrasingh Pawar, [Vidushi Gupta](https://www.linkedin.com/in/vidushi-gupta07/), [Jasleen Sondhi](https://www.linkedin.com/in/jasleen-sondhi/)
+
+||
+|:---:|
+| מדעי הנתונים למתחילים - _סקצ'נוט מאת [@nitya](https://twitter.com/nitya)_ |
+
+### 🌐 תמיכה רב-לשונית
+
+#### נתמכת באמצעות GitHub Action (אוטומטית ותמיד מעודכנת)
+
+[French](../fr/README.md) | [Spanish](../es/README.md) | [German](../de/README.md) | [Russian](../ru/README.md) | [Arabic](../ar/README.md) | [Persian (Farsi)](../fa/README.md) | [Urdu](../ur/README.md) | [Chinese (Simplified)](../zh/README.md) | [Chinese (Traditional, Macau)](../mo/README.md) | [Chinese (Traditional, Hong Kong)](../hk/README.md) | [Chinese (Traditional, Taiwan)](../tw/README.md) | [Japanese](../ja/README.md) | [Korean](../ko/README.md) | [Hindi](../hi/README.md) | [Bengali](../bn/README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Portuguese (Portugal)](../pt/README.md) | [Portuguese (Brazil)](../br/README.md) | [Italian](../it/README.md) | [Polish](../pl/README.md) | [Turkish](../tr/README.md) | [Greek](../el/README.md) | [Thai](../th/README.md) | [Swedish](../sv/README.md) | [Danish](../da/README.md) | [Norwegian](../no/README.md) | [Finnish](../fi/README.md) | [Dutch](../nl/README.md) | [Hebrew](./README.md) | [Vietnamese](../vi/README.md) | [Indonesian](../id/README.md) | [Malay](../ms/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Swahili](../sw/README.md) | [Hungarian](../hu/README.md) | [Czech](../cs/README.md) | [Slovak](../sk/README.md) | [Romanian](../ro/README.md) | [Bulgarian](../bg/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Croatian](../hr/README.md) | [Slovenian](../sl/README.md) | [Ukrainian](../uk/README.md) | [Burmese (Myanmar)](../my/README.md)
+
+**אם תרצו להוסיף שפות נוספות, רשימת השפות הנתמכות נמצאת [כאן](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md)**
+
+#### הצטרפו לקהילה שלנו
+[](https://discord.gg/kzRShWzttr)
+
+# האם אתם סטודנטים?
+
+התחילו עם המשאבים הבאים:
+
+- [עמוד מרכז הסטודנטים](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) בעמוד זה תמצאו משאבים למתחילים, חבילות לסטודנטים ואפילו דרכים לקבל שובר הסמכה בחינם. זהו עמוד שכדאי לשמור ולבדוק מדי פעם, שכן אנו מעדכנים את התוכן לפחות פעם בחודש.
+- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) הצטרפו לקהילה גלובלית של שגרירי סטודנטים, זו יכולה להיות הדרך שלכם להיכנס ל-Microsoft.
+
+# איך להתחיל
+
+> **מורים**: כללנו [כמה הצעות](for-teachers.md) כיצד להשתמש בתוכנית הלימודים הזו. נשמח לקבל את המשוב שלכם [בפורום הדיונים שלנו](https://github.com/microsoft/Data-Science-For-Beginners/discussions)!
+
+> **[סטודנטים](https://aka.ms/student-page)**: כדי להשתמש בתוכנית הלימודים הזו באופן עצמאי, עשו fork לכל הריפו והשלימו את התרגילים בעצמכם, החל ממבחן לפני השיעור. לאחר מכן, קראו את השיעור והשלימו את שאר הפעילויות. נסו ליצור את הפרויקטים על ידי הבנת השיעורים במקום להעתיק את קוד הפתרון; עם זאת, הקוד זמין בתיקיות /solutions בכל שיעור מבוסס פרויקט. רעיון נוסף הוא ליצור קבוצת לימוד עם חברים ולעבור על התוכן יחד. ללימוד נוסף, אנו ממליצים על [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum).
+
+## הכירו את הצוות
+
+[](https://youtu.be/8mzavjQSMM4 "סרטון פרומו")
+
+**Gif מאת** [Mohit Jaisal](https://www.linkedin.com/in/mohitjaisal)
+
+> 🎥 לחצו על התמונה למעלה לצפייה בסרטון על הפרויקט והאנשים שיצרו אותו!
+
+## פדגוגיה
+
+בחרנו שני עקרונות פדגוגיים בעת בניית תוכנית הלימודים הזו: להבטיח שהיא מבוססת פרויקטים ושכוללת מבחנים תכופים. בסוף הסדרה, סטודנטים ילמדו עקרונות בסיסיים במדעי הנתונים, כולל מושגים אתיים, הכנת נתונים, דרכים שונות לעבוד עם נתונים, ויזואליזציה של נתונים, ניתוח נתונים, שימושים בעולם האמיתי במדעי הנתונים ועוד.
+
+בנוסף, מבחן קל לפני השיעור מכוון את הסטודנט ללמידת הנושא, בעוד מבחן שני לאחר השיעור מבטיח שימור נוסף של החומר. תוכנית הלימודים הזו תוכננה להיות גמישה ומהנה וניתן ללמוד אותה בשלמותה או בחלקים. הפרויקטים מתחילים קטנים והופכים מורכבים יותר בסוף מחזור של 10 שבועות.
+> מצאו את [קוד ההתנהגות](CODE_OF_CONDUCT.md), [תרומה](CONTRIBUTING.md), [הנחיות תרגום](TRANSLATIONS.md). נשמח לקבל את המשוב הבונה שלכם!
+## כל שיעור כולל:
+
+- סקיצה אופציונלית
+- סרטון משלים אופציונלי
+- שאלון חימום לפני השיעור
+- שיעור כתוב
+- עבור שיעורים מבוססי פרויקטים, מדריכים שלב אחר שלב לבניית הפרויקט
+- בדיקות ידע
+- אתגר
+- קריאה משלימה
+- משימה
+- [שאלון לאחר השיעור](https://ff-quizzes.netlify.app/en/)
+
+> **הערה לגבי שאלונים**: כל השאלונים נמצאים בתיקיית Quiz-App, סה"כ 40 שאלונים עם שלוש שאלות בכל אחד. הם מקושרים מתוך השיעורים, אך ניתן להפעיל את אפליקציית השאלונים באופן מקומי או לפרוס אותה ב-Azure; עקבו אחר ההוראות בתיקיית `quiz-app`. הם מתורגמים בהדרגה.
+
+## שיעורים
+
+| ](./sketchnotes/00-Roadmap.png)|
+|:---:|
+| מדעי הנתונים למתחילים: מפת דרכים - _סקיצה מאת [@nitya](https://twitter.com/nitya)_ |
+
+| מספר שיעור | נושא | קבוצת שיעורים | מטרות למידה | שיעור מקושר | מחבר |
+| :-----------: | :----------------------------------------: | :--------------------------------------------------: | :-----------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :---------------------------------------------------------------------: | :----: |
+| 01 | הגדרת מדעי הנתונים | [מבוא](1-Introduction/README.md) | למדו את המושגים הבסיסיים מאחורי מדעי הנתונים וכיצד הם קשורים לבינה מלאכותית, למידת מכונה ונתונים גדולים. | [שיעור](1-Introduction/01-defining-data-science/README.md) [סרטון](https://youtu.be/beZ7Mb_oz9I) | [Dmitry](http://soshnikov.com) |
+| 02 | אתיקה במדעי הנתונים | [מבוא](1-Introduction/README.md) | מושגים, אתגרים ומסגרות באתיקה של נתונים. | [שיעור](1-Introduction/02-ethics/README.md) | [Nitya](https://twitter.com/nitya) |
+| 03 | הגדרת נתונים | [מבוא](1-Introduction/README.md) | כיצד נתונים מסווגים ומקורותיהם הנפוצים. | [שיעור](1-Introduction/03-defining-data/README.md) | [Jasmine](https://www.twitter.com/paladique) |
+| 04 | מבוא לסטטיסטיקה והסתברות | [מבוא](1-Introduction/README.md) | טכניקות מתמטיות של הסתברות וסטטיסטיקה להבנת נתונים. | [שיעור](1-Introduction/04-stats-and-probability/README.md) [סרטון](https://youtu.be/Z5Zy85g4Yjw) | [Dmitry](http://soshnikov.com) |
+| 05 | עבודה עם נתונים יחסיים | [עבודה עם נתונים](2-Working-With-Data/README.md) | מבוא לנתונים יחסיים והבסיס לחקר וניתוח נתונים יחסיים באמצעות שפת SQL, הידועה גם כ-"סי-קוול". | [שיעור](2-Working-With-Data/05-relational-databases/README.md) | [Christopher](https://www.twitter.com/geektrainer) | | |
+| 06 | עבודה עם נתוני NoSQL | [עבודה עם נתונים](2-Working-With-Data/README.md) | מבוא לנתונים לא יחסיים, סוגיהם השונים והבסיס לחקר וניתוח מסדי נתונים מבוססי מסמכים. | [שיעור](2-Working-With-Data/06-non-relational/README.md) | [Jasmine](https://twitter.com/paladique)|
+| 07 | עבודה עם Python | [עבודה עם נתונים](2-Working-With-Data/README.md) | יסודות השימוש ב-Python לחקר נתונים עם ספריות כמו Pandas. מומלץ ידע בסיסי בתכנות ב-Python. | [שיעור](2-Working-With-Data/07-python/README.md) [סרטון](https://youtu.be/dZjWOGbsN4Y) | [Dmitry](http://soshnikov.com) |
+| 08 | הכנת נתונים | [עבודה עם נתונים](2-Working-With-Data/README.md) | נושאים על טכניקות לניקוי והמרת נתונים כדי להתמודד עם אתגרים של נתונים חסרים, לא מדויקים או לא שלמים. | [שיעור](2-Working-With-Data/08-data-preparation/README.md) | [Jasmine](https://www.twitter.com/paladique) |
+| 09 | ויזואליזציה של כמויות | [ויזואליזציה של נתונים](3-Data-Visualization/README.md) | למדו כיצד להשתמש ב-Matplotlib כדי להציג נתוני ציפורים 🦆 | [שיעור](3-Data-Visualization/09-visualization-quantities/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 10 | ויזואליזציה של התפלגויות נתונים | [ויזואליזציה של נתונים](3-Data-Visualization/README.md) | הצגת תצפיות ומגמות בתוך טווח. | [שיעור](3-Data-Visualization/10-visualization-distributions/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 11 | ויזואליזציה של פרופורציות | [ויזואליזציה של נתונים](3-Data-Visualization/README.md) | הצגת אחוזים בדידים ומקובצים. | [שיעור](3-Data-Visualization/11-visualization-proportions/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 12 | ויזואליזציה של קשרים | [ויזואליזציה של נתונים](3-Data-Visualization/README.md) | הצגת קשרים וקורלציות בין קבוצות נתונים ומשתנים שלהם. | [שיעור](3-Data-Visualization/12-visualization-relationships/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 13 | ויזואליזציות משמעותיות | [ויזואליזציה של נתונים](3-Data-Visualization/README.md) | טכניקות והנחיות ליצירת ויזואליזציות בעלות ערך לפתרון בעיות יעיל ותובנות. | [שיעור](3-Data-Visualization/13-meaningful-visualizations/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 14 | מבוא למחזור החיים של מדעי הנתונים | [מחזור חיים](4-Data-Science-Lifecycle/README.md) | מבוא למחזור החיים של מדעי הנתונים והשלב הראשון של רכישה וחילוץ נתונים. | [שיעור](4-Data-Science-Lifecycle/14-Introduction/README.md) | [Jasmine](https://twitter.com/paladique) |
+| 15 | ניתוח | [מחזור חיים](4-Data-Science-Lifecycle/README.md) | שלב זה במחזור החיים של מדעי הנתונים מתמקד בטכניקות לניתוח נתונים. | [שיעור](4-Data-Science-Lifecycle/15-analyzing/README.md) | [Jasmine](https://twitter.com/paladique) | | |
+| 16 | תקשורת | [מחזור חיים](4-Data-Science-Lifecycle/README.md) | שלב זה במחזור החיים של מדעי הנתונים מתמקד בהצגת התובנות מהנתונים בצורה שמקלה על מקבלי ההחלטות להבין. | [שיעור](4-Data-Science-Lifecycle/16-communication/README.md) | [Jalen](https://twitter.com/JalenMcG) | | |
+| 17 | מדעי הנתונים בענן | [נתונים בענן](5-Data-Science-In-Cloud/README.md) | סדרת שיעורים זו מציגה את מדעי הנתונים בענן ואת יתרונותיהם. | [שיעור](5-Data-Science-In-Cloud/17-Introduction/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) ו-[Maud](https://twitter.com/maudstweets) |
+| 18 | מדעי הנתונים בענן | [נתונים בענן](5-Data-Science-In-Cloud/README.md) | אימון מודלים באמצעות כלים בעלי קוד נמוך. |[שיעור](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) ו-[Maud](https://twitter.com/maudstweets) |
+| 19 | מדעי הנתונים בענן | [נתונים בענן](5-Data-Science-In-Cloud/README.md) | פריסת מודלים עם Azure Machine Learning Studio. | [שיעור](5-Data-Science-In-Cloud/19-Azure/README.md)| [Tiffany](https://twitter.com/TiffanySouterre) ו-[Maud](https://twitter.com/maudstweets) |
+| 20 | מדעי הנתונים בשטח | [בשטח](6-Data-Science-In-Wild/README.md) | פרויקטים מונעי מדעי נתונים בעולם האמיתי. | [שיעור](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [Nitya](https://twitter.com/nitya) |
+
+## GitHub Codespaces
+
+עקבו אחר השלבים הבאים לפתיחת דוגמה זו ב-Codespace:
+1. לחצו על תפריט Code ובחרו באפשרות Open with Codespaces.
+2. בחרו + New codespace בתחתית החלונית.
+למידע נוסף, עיינו ב-[תיעוד GitHub](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace).
+
+## VSCode Remote - Containers
+עקבו אחר השלבים הבאים לפתיחת מאגר זה במיכל באמצעות המחשב המקומי שלכם ו-VSCode באמצעות הרחבת VS Code Remote - Containers:
+
+1. אם זו הפעם הראשונה שאתם משתמשים במיכל פיתוח, ודאו שהמערכת שלכם עומדת בדרישות המקדימות (כלומר, התקנת Docker) ב-[תיעוד ההתחלה](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started).
+
+כדי להשתמש במאגר זה, תוכלו לפתוח את המאגר במיכל Docker מבודד:
+
+**הערה**: מאחורי הקלעים, פעולה זו תשתמש בפקודה Remote-Containers: **Clone Repository in Container Volume...** כדי לשכפל את קוד המקור בנפח Docker במקום במערכת הקבצים המקומית. [Volumes](https://docs.docker.com/storage/volumes/) הם המנגנון המועדף לשמירת נתוני מיכלים.
+
+או לפתוח גרסה משוכפלת או שהורדה באופן מקומי של המאגר:
+
+- שכפלו את המאגר הזה למערכת הקבצים המקומית שלכם.
+- לחצו על F1 ובחרו בפקודה **Remote-Containers: Open Folder in Container...**.
+- בחרו את העותק המשוכפל של תיקייה זו, המתינו עד שהמיכל יתחיל, ונסו דברים.
+
+## גישה לא מקוונת
+
+ניתן להפעיל את התיעוד הזה באופן לא מקוון באמצעות [Docsify](https://docsify.js.org/#/). שכפלו את המאגר הזה, [התקינו את Docsify](https://docsify.js.org/#/quickstart) במחשב המקומי שלכם, ואז בתיקיית השורש של המאגר הזה, הקלידו `docsify serve`. האתר יוגש על פורט 3000 ב-localhost שלכם: `localhost:3000`.
+
+> שימו לב, מחברות לא יופיעו דרך Docsify, ולכן כאשר יש צורך להפעיל מחברת, עשו זאת בנפרד ב-VS Code עם קרנל Python פעיל.
+
+## תכניות לימודים אחרות
+
+הצוות שלנו מייצר תכניות לימודים נוספות! בדקו:
+
+- [Generative AI למתחילים](https://aka.ms/genai-beginners)
+- [Generative AI למתחילים .NET](https://github.com/microsoft/Generative-AI-for-beginners-dotnet)
+- [Generative AI עם JavaScript](https://github.com/microsoft/generative-ai-with-javascript)
+- [Generative AI עם Java](https://aka.ms/genaijava)
+- [AI למתחילים](https://aka.ms/ai-beginners)
+- [מדעי הנתונים למתחילים](https://aka.ms/datascience-beginners)
+- [ML למתחילים](https://aka.ms/ml-beginners)
+- [סייבר למתחילים](https://github.com/microsoft/Security-101)
+- [פיתוח אתרים למתחילים](https://aka.ms/webdev-beginners)
+- [IoT למתחילים](https://aka.ms/iot-beginners)
+- [פיתוח XR למתחילים](https://github.com/microsoft/xr-development-for-beginners)
+- [שליטה ב-GitHub Copilot לתכנות זוגי](https://github.com/microsoft/Mastering-GitHub-Copilot-for-Paired-Programming)
+- [שליטה ב-GitHub Copilot למפתחי C#/.NET](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers)
+- [בחרו את הרפתקת Copilot שלכם](https://github.com/microsoft/CopilotAdventures)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/SECURITY.md b/translations/he/SECURITY.md
new file mode 100644
index 00000000..530d875e
--- /dev/null
+++ b/translations/he/SECURITY.md
@@ -0,0 +1,51 @@
+
+## אבטחה
+
+מיקרוסופט מתייחסת ברצינות לאבטחת מוצרי התוכנה והשירותים שלה, כולל כל מאגרי הקוד המקוריים המנוהלים דרך הארגונים שלנו ב-GitHub, הכוללים [Microsoft](https://github.com/Microsoft), [Azure](https://github.com/Azure), [DotNet](https://github.com/dotnet), [AspNet](https://github.com/aspnet), [Xamarin](https://github.com/xamarin), ו-[ארגוני GitHub שלנו](https://opensource.microsoft.com/).
+
+אם אתם מאמינים שמצאתם פגיעות אבטחה באחד ממאגרי הקוד שבבעלות מיקרוסופט, אשר עומדת בהגדרת [פגיעות אבטחה של מיקרוסופט](https://docs.microsoft.com/en-us/previous-versions/tn-archive/cc751383(v=technet.10)), אנא דווחו לנו כפי שמתואר להלן.
+
+## דיווח על בעיות אבטחה
+
+**אנא אל תדווחו על פגיעות אבטחה דרך נושאים ציבוריים ב-GitHub.**
+
+במקום זאת, דווחו עליהן למרכז התגובה לאבטחת מידע של מיקרוסופט (MSRC) בכתובת [https://msrc.microsoft.com/create-report](https://msrc.microsoft.com/create-report).
+
+אם אתם מעדיפים לשלוח דיווח ללא התחברות, שלחו דוא"ל לכתובת [secure@microsoft.com](mailto:secure@microsoft.com). אם אפשר, הצפינו את ההודעה שלכם באמצעות מפתח ה-PGP שלנו; ניתן להוריד אותו מדף [Microsoft Security Response Center PGP Key](https://www.microsoft.com/en-us/msrc/pgp-key-msrc).
+
+אתם אמורים לקבל תגובה תוך 24 שעות. אם מסיבה כלשהי לא קיבלתם תגובה, אנא עקבו באמצעות דוא"ל כדי לוודא שההודעה המקורית שלכם התקבלה. מידע נוסף ניתן למצוא ב-[microsoft.com/msrc](https://www.microsoft.com/msrc).
+
+אנא כללו את המידע המבוקש המפורט להלן (ככל שתוכלו לספק) כדי לעזור לנו להבין טוב יותר את אופי והיקף הבעיה האפשרית:
+
+ * סוג הבעיה (לדוגמה, גלישת חוצץ, הזרקת SQL, סקריפטים בין אתרים וכו')
+ * נתיבי הקבצים המלאים הקשורים להופעת הבעיה
+ * מיקום קוד המקור הפגוע (תג/ענף/מחויבות או URL ישיר)
+ * כל תצורה מיוחדת הנדרשת לשחזור הבעיה
+ * הוראות מפורטות לשחזור הבעיה
+ * קוד הוכחת רעיון או ניצול (אם אפשרי)
+ * השפעת הבעיה, כולל כיצד תוקף עשוי לנצל אותה
+
+מידע זה יעזור לנו לטפל בדיווח שלכם במהירות רבה יותר.
+
+אם אתם מדווחים במסגרת תוכנית באג באונטי, דיווחים מפורטים יותר עשויים לתרום לפרס גבוה יותר. אנא בקרו בדף [Microsoft Bug Bounty Program](https://microsoft.com/msrc/bounty) שלנו למידע נוסף על התוכניות הפעילות.
+
+## שפות מועדפות
+
+אנו מעדיפים שכל התקשורת תהיה באנגלית.
+
+## מדיניות
+
+מיקרוסופט פועלת לפי עקרון [גילוי פגיעות מתואם](https://www.microsoft.com/en-us/msrc/cvd).
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/SUPPORT.md b/translations/he/SUPPORT.md
new file mode 100644
index 00000000..bc210d54
--- /dev/null
+++ b/translations/he/SUPPORT.md
@@ -0,0 +1,24 @@
+
+# תמיכה
+## כיצד לדווח על בעיות ולקבל עזרה
+
+פרויקט זה משתמש ב-GitHub Issues למעקב אחר באגים ובקשות לתכונות. אנא חפשו בעיות קיימות לפני שאתם מדווחים על בעיות חדשות כדי להימנע מכפילויות. עבור בעיות חדשות, דווחו על הבאג או בקשת התכונה שלכם כבעיה חדשה.
+
+לעזרה ושאלות בנוגע לשימוש בפרויקט זה, דווחו על בעיה.
+
+## מדיניות התמיכה של Microsoft
+
+התמיכה במאגר זה מוגבלת למשאבים המפורטים לעיל.
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לאי-הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/docs/_sidebar.md b/translations/he/docs/_sidebar.md
new file mode 100644
index 00000000..bcce9f71
--- /dev/null
+++ b/translations/he/docs/_sidebar.md
@@ -0,0 +1,40 @@
+
+- הקדמה
+ - [הגדרת מדע הנתונים](../1-Introduction/01-defining-data-science/README.md)
+ - [אתיקה במדע הנתונים](../1-Introduction/02-ethics/README.md)
+ - [הגדרת נתונים](../1-Introduction/03-defining-data/README.md)
+ - [הסתברות וסטטיסטיקה](../1-Introduction/04-stats-and-probability/README.md)
+- עבודה עם נתונים
+ - [מאגרי נתונים יחסיים](../2-Working-With-Data/05-relational-databases/README.md)
+ - [מאגרי נתונים לא יחסיים](../2-Working-With-Data/06-non-relational/README.md)
+ - [Python](../2-Working-With-Data/07-python/README.md)
+ - [הכנת נתונים](../2-Working-With-Data/08-data-preparation/README.md)
+- ויזואליזציה של נתונים
+ - [הצגת כמויות](../3-Data-Visualization/09-visualization-quantities/README.md)
+ - [הצגת התפלגויות](../3-Data-Visualization/10-visualization-distributions/README.md)
+ - [הצגת פרופורציות](../3-Data-Visualization/11-visualization-proportions/README.md)
+ - [הצגת קשרים](../3-Data-Visualization/12-visualization-relationships/README.md)
+ - [ויזואליזציות משמעותיות](../3-Data-Visualization/13-meaningful-visualizations/README.md)
+- מחזור החיים של מדע הנתונים
+ - [הקדמה](../4-Data-Science-Lifecycle/14-Introduction/README.md)
+ - [ניתוח](../4-Data-Science-Lifecycle/15-analyzing/README.md)
+ - [תקשורת](../4-Data-Science-Lifecycle/16-communication/README.md)
+- מדע הנתונים בענן
+ - [הקדמה](../5-Data-Science-In-Cloud/17-Introduction/README.md)
+ - [קוד נמוך](../5-Data-Science-In-Cloud/18-Low-Code/README.md)
+ - [Azure](../5-Data-Science-In-Cloud/19-Azure/README.md)
+- מדע הנתונים בשטח
+ - [מדע הנתונים בשטח](../6-Data-Science-In-Wild/README.md)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. עבור מידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי אדם. איננו אחראים לאי הבנות או לפרשנויות שגויות הנובעות משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/for-teachers.md b/translations/he/for-teachers.md
new file mode 100644
index 00000000..aa970aa8
--- /dev/null
+++ b/translations/he/for-teachers.md
@@ -0,0 +1,78 @@
+
+## למורים
+
+האם תרצו להשתמש בתוכנית הלימודים הזו בכיתה שלכם? אתם מוזמנים לעשות זאת!
+
+למעשה, תוכלו להשתמש בה ישירות בתוך GitHub באמצעות GitHub Classroom.
+
+כדי לעשות זאת, יש לבצע fork למאגר הזה. תצטרכו ליצור מאגר נפרד לכל שיעור, ולכן תצטרכו להפריד כל תיקייה למאגר נפרד. כך [GitHub Classroom](https://classroom.github.com/classrooms) יוכל לזהות כל שיעור בנפרד.
+
+הוראות [מלאות](https://github.blog/2020-03-18-set-up-your-digital-classroom-with-github-classroom/) יספקו לכם רעיון כיצד להקים את הכיתה שלכם.
+
+## שימוש במאגר כפי שהוא
+
+אם תרצו להשתמש במאגר כפי שהוא כרגע, מבלי להשתמש ב-GitHub Classroom, גם זה אפשרי. תצטרכו לתקשר עם התלמידים שלכם איזה שיעור לעבור יחד.
+
+בפורמט מקוון (Zoom, Teams או אחר) תוכלו ליצור חדרי עבודה עבור החידונים, ולהנחות את התלמידים כדי להכין אותם ללמידה. לאחר מכן, הזמינו את התלמידים להשתתף בחידונים ולהגיש את תשובותיהם כ'issues' בזמן מסוים. תוכלו לעשות את אותו הדבר עם משימות, אם תרצו שהתלמידים יעבדו בשיתוף פעולה באופן פתוח.
+
+אם אתם מעדיפים פורמט יותר פרטי, בקשו מהתלמידים לבצע fork לתוכנית הלימודים, שיעור אחר שיעור, למאגרים פרטיים משלהם ב-GitHub, ותנו לכם גישה. כך הם יוכלו להשלים חידונים ומשימות באופן פרטי ולהגיש אותם לכם דרך issues במאגר הכיתה שלכם.
+
+ישנן דרכים רבות לגרום לזה לעבוד בפורמט כיתה מקוון. אנא ספרו לנו מה עובד הכי טוב עבורכם!
+
+## מה כלול בתוכנית הלימודים:
+
+20 שיעורים, 40 חידונים ו-20 משימות. איורים מלווים את השיעורים עבור לומדים חזותיים. שיעורים רבים זמינים גם ב-Python וגם ב-R וניתן להשלים אותם באמצעות Jupyter notebooks ב-VS Code. למדו עוד על איך להקים את הכיתה שלכם לשימוש בטכנולוגיה הזו: https://code.visualstudio.com/docs/datascience/jupyter-notebooks.
+
+כל האיורים, כולל פוסטר בפורמט גדול, נמצאים [בתיקייה הזו](../../sketchnotes).
+
+תוכנית הלימודים כולה זמינה [כקובץ PDF](../../pdf/readme.pdf).
+
+תוכלו גם להפעיל את תוכנית הלימודים הזו כאתר עצמאי, ידידותי לעבודה לא מקוונת, באמצעות [Docsify](https://docsify.js.org/#/). [התקינו את Docsify](https://docsify.js.org/#/quickstart) על המחשב המקומי שלכם, ואז בתיקיית השורש של העותק המקומי של המאגר הזה, הקלידו `docsify serve`. האתר יופעל על פורט 3000 ב-localhost שלכם: `localhost:3000`.
+
+גרסה ידידותית לעבודה לא מקוונת של תוכנית הלימודים תיפתח כעמוד אינטרנט עצמאי: https://localhost:3000
+
+השיעורים מחולקים ל-6 חלקים:
+
+- 1: מבוא
+ - 1: הגדרת מדעי הנתונים
+ - 2: אתיקה
+ - 3: הגדרת נתונים
+ - 4: סקירה של הסתברות וסטטיסטיקה
+- 2: עבודה עם נתונים
+ - 5: מסדי נתונים יחסיים
+ - 6: מסדי נתונים לא יחסיים
+ - 7: Python
+ - 8: הכנת נתונים
+- 3: ויזואליזציה של נתונים
+ - 9: ויזואליזציה של כמויות
+ - 10: ויזואליזציה של התפלגויות
+ - 11: ויזואליזציה של פרופורציות
+ - 12: ויזואליזציה של קשרים
+ - 13: ויזואליזציות משמעותיות
+- 4: מחזור החיים של מדעי הנתונים
+ - 14: מבוא
+ - 15: ניתוח
+ - 16: תקשורת
+- 5: מדעי הנתונים בענן
+ - 17: מבוא
+ - 18: אפשרויות ללא קוד
+ - 19: Azure
+- 6: מדעי הנתונים בשטח
+ - 20: סקירה
+
+## נשמח לשמוע את דעתכם!
+
+אנחנו רוצים שתוכנית הלימודים הזו תעבוד עבורכם ועבור התלמידים שלכם. אנא ספקו לנו משוב בלוחות הדיון! אתם מוזמנים ליצור אזור כיתה בלוחות הדיון עבור התלמידים שלכם.
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). למרות שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/quiz-app/README.md b/translations/he/quiz-app/README.md
new file mode 100644
index 00000000..2c8094e7
--- /dev/null
+++ b/translations/he/quiz-app/README.md
@@ -0,0 +1,139 @@
+
+# חידונים
+
+החידונים האלה הם חידוני טרום ואחרי הרצאה עבור תוכנית הלימודים למדעי הנתונים בכתובת https://aka.ms/datascience-beginners
+
+## הוספת סט חידונים מתורגם
+
+הוסף תרגום לחידון על ידי יצירת מבני חידון תואמים בתיקיות `assets/translations`. החידונים המקוריים נמצאים ב-`assets/translations/en`. החידונים מחולקים לכמה קבוצות. ודא שהמספור תואם את החלק המתאים של החידון. ישנם 40 חידונים בסך הכל בתוכנית הלימודים הזו, עם המספור שמתחיל מ-0.
+
+לאחר עריכת התרגומים, ערוך את קובץ index.js בתיקיית התרגום כדי לייבא את כל הקבצים בהתאם למוסכמות ב-`en`.
+
+ערוך את קובץ `index.js` ב-`assets/translations` כדי לייבא את הקבצים המתורגמים החדשים.
+
+לאחר מכן, ערוך את התפריט הנפתח ב-`App.vue` באפליקציה הזו כדי להוסיף את השפה שלך. התאמה בין הקיצור המקומי לשם התיקייה עבור השפה שלך.
+
+לבסוף, ערוך את כל קישורי החידונים בשיעורים המתורגמים, אם הם קיימים, כדי לכלול את הלוקליזציה הזו כפרמטר שאילתה: `?loc=fr` לדוגמה.
+
+## הגדרת הפרויקט
+
+```
+npm install
+```
+
+### קומפילציה וטעינה מחדש לפיתוח
+
+```
+npm run serve
+```
+
+### קומפילציה ומזעור עבור הפקה
+
+```
+npm run build
+```
+
+### בדיקת קוד ותיקון קבצים
+
+```
+npm run lint
+```
+
+### התאמת הגדרות
+
+ראה [הפניה להגדרות](https://cli.vuejs.org/config/).
+
+קרדיטים: תודה לגרסה המקורית של אפליקציית החידונים הזו: https://github.com/arpan45/simple-quiz-vue
+
+## פריסה ל-Azure
+
+הנה מדריך שלב אחר שלב שיעזור לך להתחיל:
+
+1. בצע Fork למאגר GitHub
+ודא שקוד האפליקציה הסטטית שלך נמצא במאגר GitHub שלך. בצע Fork למאגר הזה.
+
+2. צור אפליקציה סטטית ב-Azure
+- צור [חשבון Azure](http://azure.microsoft.com)
+- עבור ל-[פורטל Azure](https://portal.azure.com)
+- לחץ על "Create a resource" וחפש "Static Web App".
+- לחץ על "Create".
+
+3. הגדר את האפליקציה הסטטית
+- בסיסי:
+ - Subscription: בחר את המנוי שלך ב-Azure.
+ - Resource Group: צור קבוצת משאבים חדשה או השתמש בקיימת.
+ - Name: ספק שם לאפליקציה הסטטית שלך.
+ - Region: בחר את האזור הקרוב ביותר למשתמשים שלך.
+
+- #### פרטי פריסה:
+ - Source: בחר "GitHub".
+ - GitHub Account: אשר ל-Azure גישה לחשבון GitHub שלך.
+ - Organization: בחר את הארגון שלך ב-GitHub.
+ - Repository: בחר את המאגר שמכיל את האפליקציה הסטטית שלך.
+ - Branch: בחר את הענף שממנו תרצה לפרוס.
+
+- #### פרטי בנייה:
+ - Build Presets: בחר את המסגרת שבה האפליקציה שלך נבנתה (לדוגמה, React, Angular, Vue וכו').
+ - App Location: ציין את התיקייה שמכילה את קוד האפליקציה שלך (לדוגמה, / אם היא נמצאת בשורש).
+ - API Location: אם יש לך API, ציין את מיקומו (אופציונלי).
+ - Output Location: ציין את התיקייה שבה נוצר פלט הבנייה (לדוגמה, build או dist).
+
+4. סקירה ויצירה
+סקור את ההגדרות שלך ולחץ על "Create". Azure יגדיר את המשאבים הנדרשים וייצור קובץ GitHub Actions במאגר שלך.
+
+5. קובץ GitHub Actions Workflow
+Azure ייצור באופן אוטומטי קובץ GitHub Actions Workflow במאגר שלך (.github/workflows/azure-static-web-apps-.yml). קובץ זה יטפל בתהליך הבנייה והפריסה.
+
+6. מעקב אחר הפריסה
+עבור ללשונית "Actions" במאגר GitHub שלך.
+אתה אמור לראות Workflow פועל. Workflow זה יבנה ויפרס את האפליקציה הסטטית שלך ל-Azure.
+לאחר שה-Workflow יושלם, האפליקציה שלך תהיה זמינה בכתובת ה-URL שסופקה על ידי Azure.
+
+### דוגמה לקובץ Workflow
+
+הנה דוגמה לאיך קובץ GitHub Actions Workflow עשוי להיראות:
+name: Azure Static Web Apps CI/CD
+```
+on:
+ push:
+ branches:
+ - main
+ pull_request:
+ types: [opened, synchronize, reopened, closed]
+ branches:
+ - main
+
+jobs:
+ build_and_deploy_job:
+ runs-on: ubuntu-latest
+ name: Build and Deploy Job
+ steps:
+ - uses: actions/checkout@v2
+ - name: Build And Deploy
+ id: builddeploy
+ uses: Azure/static-web-apps-deploy@v1
+ with:
+ azure_static_web_apps_api_token: ${{ secrets.AZURE_STATIC_WEB_APPS_API_TOKEN }}
+ repo_token: ${{ secrets.GITHUB_TOKEN }}
+ action: "upload"
+ app_location: "quiz-app" # App source code path
+ api_location: ""API source code path optional
+ output_location: "dist" #Built app content directory - optional
+```
+
+### משאבים נוספים
+- [תיעוד אפליקציות סטטיות ב-Azure](https://learn.microsoft.com/azure/static-web-apps/getting-started)
+- [תיעוד GitHub Actions](https://docs.github.com/actions/use-cases-and-examples/deploying/deploying-to-azure-static-web-app)
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד אנו שואפים לדיוק, יש להיות מודעים לכך שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית צריך להיחשב כמקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי בני אדם. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/he/sketchnotes/README.md b/translations/he/sketchnotes/README.md
new file mode 100644
index 00000000..c5996ce3
--- /dev/null
+++ b/translations/he/sketchnotes/README.md
@@ -0,0 +1,21 @@
+
+מצא את כל הסקצ'נוטים כאן!
+
+## קרדיטים
+
+ניטיה נאראסימהן, אמנית
+
+
+
+---
+
+**כתב ויתור**:
+מסמך זה תורגם באמצעות שירות תרגום מבוסס בינה מלאכותית [Co-op Translator](https://github.com/Azure/co-op-translator). בעוד שאנו שואפים לדיוק, יש לקחת בחשבון שתרגומים אוטומטיים עשויים להכיל שגיאות או אי-דיוקים. המסמך המקורי בשפתו המקורית נחשב למקור הסמכותי. למידע קריטי, מומלץ להשתמש בתרגום מקצועי על ידי מתרגם אנושי. איננו נושאים באחריות לכל אי-הבנה או פרשנות שגויה הנובעת משימוש בתרגום זה.
\ No newline at end of file
diff --git a/translations/nl/1-Introduction/01-defining-data-science/README.md b/translations/nl/1-Introduction/01-defining-data-science/README.md
new file mode 100644
index 00000000..0b20d94a
--- /dev/null
+++ b/translations/nl/1-Introduction/01-defining-data-science/README.md
@@ -0,0 +1,124 @@
+
+# Definiëren van Data Science
+
+|  ](../../sketchnotes/01-Definitions.png) |
+| :----------------------------------------------------------------------------------------------------: |
+| Definiëren van Data Science - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+---
+
+[](https://youtu.be/beZ7Mb_oz9I)
+
+## [Quiz voorafgaand aan de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/0)
+
+## Wat is Data?
+In ons dagelijks leven worden we voortdurend omringd door data. De tekst die je nu leest is data. De lijst met telefoonnummers van je vrienden in je smartphone is data, net als de huidige tijd die op je horloge wordt weergegeven. Als mensen werken we van nature met data door bijvoorbeeld geld te tellen of brieven te schrijven aan vrienden.
+
+Data werd echter veel belangrijker met de komst van computers. De primaire rol van computers is het uitvoeren van berekeningen, maar ze hebben data nodig om mee te werken. Daarom moeten we begrijpen hoe computers data opslaan en verwerken.
+
+Met de opkomst van het internet is de rol van computers als apparaten voor gegevensverwerking toegenomen. Als je erover nadenkt, gebruiken we computers nu steeds meer voor gegevensverwerking en communicatie, in plaats van voor daadwerkelijke berekeningen. Wanneer we een e-mail schrijven aan een vriend of informatie opzoeken op internet, zijn we in feite bezig met het creëren, opslaan, verzenden en manipuleren van data.
+> Kun je je de laatste keer herinneren dat je een computer hebt gebruikt om echt iets te berekenen?
+
+## Wat is Data Science?
+
+Volgens [Wikipedia](https://en.wikipedia.org/wiki/Data_science) wordt **Data Science** gedefinieerd als *een wetenschappelijk vakgebied dat wetenschappelijke methoden gebruikt om kennis en inzichten te halen uit gestructureerde en ongestructureerde data, en deze kennis en toepasbare inzichten uit data toe te passen in een breed scala aan toepassingsdomeinen*.
+
+Deze definitie benadrukt de volgende belangrijke aspecten van data science:
+
+* Het hoofddoel van data science is **kennis halen** uit data, met andere woorden - **data begrijpen**, verborgen relaties vinden en een **model** bouwen.
+* Data science maakt gebruik van **wetenschappelijke methoden**, zoals kansberekening en statistiek. Toen de term *data science* voor het eerst werd geïntroduceerd, beweerden sommigen dat het slechts een nieuwe, hippe naam voor statistiek was. Tegenwoordig is het duidelijk dat het vakgebied veel breder is.
+* De verkregen kennis moet worden toegepast om **bruikbare inzichten** te produceren, dat wil zeggen praktische inzichten die je kunt toepassen in echte zakelijke situaties.
+* We moeten kunnen werken met zowel **gestructureerde** als **ongestructureerde** data. Later in de cursus zullen we terugkomen op de verschillende soorten data.
+* Het **toepassingsdomein** is een belangrijk concept, en datawetenschappers hebben vaak enige mate van expertise nodig in het probleemgebied, bijvoorbeeld: financiën, geneeskunde, marketing, enz.
+
+> Een ander belangrijk aspect van Data Science is dat het bestudeert hoe data kan worden verzameld, opgeslagen en verwerkt met behulp van computers. Terwijl statistiek ons de wiskundige basis geeft, past data science wiskundige concepten toe om daadwerkelijk inzichten uit data te halen.
+
+Een van de manieren (toegeschreven aan [Jim Gray](https://en.wikipedia.org/wiki/Jim_Gray_(computer_scientist))) om naar data science te kijken, is door het te beschouwen als een apart wetenschappelijk paradigma:
+* **Empirisch**, waarbij we voornamelijk vertrouwen op observaties en resultaten van experimenten
+* **Theoretisch**, waar nieuwe concepten voortkomen uit bestaande wetenschappelijke kennis
+* **Computationeel**, waar we nieuwe principes ontdekken op basis van computationele experimenten
+* **Data-gedreven**, gebaseerd op het ontdekken van relaties en patronen in de data
+
+## Andere Gerelateerde Vakgebieden
+
+Omdat data overal aanwezig is, is data science zelf ook een breed vakgebied dat veel andere disciplines raakt.
+
+## Soorten Data
+
+Zoals we al hebben genoemd, is data overal. We hoeven het alleen maar op de juiste manier vast te leggen! Het is nuttig om onderscheid te maken tussen **gestructureerde** en **ongestructureerde** data. De eerste wordt meestal weergegeven in een goed gestructureerde vorm, vaak als een tabel of een aantal tabellen, terwijl de laatste gewoon een verzameling bestanden is. Soms spreken we ook over **semi-gestructureerde** data, die een bepaalde structuur hebben die sterk kan variëren.
+
+| Gestructureerd | Semi-gestructureerd | Ongestructureerd |
+| ---------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------- | --------------------------------------- |
+| Lijst van mensen met hun telefoonnummers | Wikipedia-pagina's met links | Tekst van de Encyclopaedia Britannica |
+| Temperatuur in alle kamers van een gebouw, elke minuut van de afgelopen 20 jaar | Verzameling wetenschappelijke artikelen in JSON-formaat met auteurs, publicatiedatum en samenvatting | Bestandsdeling met bedrijfsdocumenten |
+| Gegevens over leeftijd en geslacht van alle mensen die het gebouw binnenkomen | Internetpagina's | Ruwe videobeelden van een bewakingscamera |
+
+## Waar Data te Vinden
+
+Er zijn veel mogelijke bronnen van data, en het is onmogelijk om ze allemaal op te sommen! Laten we echter enkele typische plaatsen noemen waar je data kunt vinden:
+
+* **Gestructureerd**
+ - **Internet of Things** (IoT), inclusief gegevens van verschillende sensoren, zoals temperatuur- of druksensoren, levert veel nuttige data op. Bijvoorbeeld, als een kantoorgebouw is uitgerust met IoT-sensoren, kunnen we automatisch verwarming en verlichting regelen om kosten te minimaliseren.
+ - **Enquêtes** die we gebruikers vragen in te vullen na een aankoop of na het bezoeken van een website.
+ - **Gedragsanalyse** kan ons bijvoorbeeld helpen begrijpen hoe diep een gebruiker een site verkent en wat de typische reden is om de site te verlaten.
+* **Ongestructureerd**
+ - **Teksten** kunnen een rijke bron van inzichten zijn, zoals een algemene **sentimentscore**, of het extraheren van sleutelwoorden en semantische betekenis.
+ - **Afbeeldingen** of **Video**. Een video van een bewakingscamera kan worden gebruikt om het verkeer op de weg in te schatten en mensen te informeren over mogelijke verkeersopstoppingen.
+ - Webserver **Logs** kunnen worden gebruikt om te begrijpen welke pagina's van onze site het vaakst worden bezocht en hoe lang.
+* **Semi-gestructureerd**
+ - **Sociale Netwerk**-grafieken kunnen geweldige bronnen van data zijn over gebruikerspersoonlijkheden en de potentiële effectiviteit in het verspreiden van informatie.
+ - Wanneer we een verzameling foto's van een feestje hebben, kunnen we proberen **Groepsdynamiek**-data te extraheren door een grafiek te bouwen van mensen die samen op de foto staan.
+
+Door verschillende mogelijke databronnen te kennen, kun je nadenken over verschillende scenario's waarin data science-technieken kunnen worden toegepast om de situatie beter te begrijpen en bedrijfsprocessen te verbeteren.
+
+## Wat je met Data kunt Doen
+
+In Data Science richten we ons op de volgende stappen in de datareis:
+
+Natuurlijk kunnen, afhankelijk van de specifieke data, sommige stappen ontbreken (bijvoorbeeld wanneer we de data al in de database hebben, of wanneer we geen modeltraining nodig hebben), of kunnen sommige stappen meerdere keren worden herhaald (zoals gegevensverwerking).
+
+## Digitalisering en Digitale Transformatie
+
+In het afgelopen decennium zijn veel bedrijven het belang van data bij het nemen van zakelijke beslissingen gaan inzien. Om data science-principes toe te passen op het runnen van een bedrijf, moet je eerst data verzamelen, oftewel bedrijfsprocessen vertalen naar digitale vorm. Dit staat bekend als **digitalisering**. Het toepassen van data science-technieken op deze data om beslissingen te sturen, kan leiden tot aanzienlijke productiviteitsverhogingen (of zelfs een bedrijfsomslag), wat **digitale transformatie** wordt genoemd.
+
+Laten we een voorbeeld bekijken. Stel dat we een data science-cursus hebben (zoals deze) die we online aan studenten aanbieden, en we willen data science gebruiken om deze te verbeteren. Hoe kunnen we dat doen?
+
+We kunnen beginnen met de vraag: "Wat kan worden gedigitaliseerd?" De eenvoudigste manier zou zijn om de tijd te meten die elke student nodig heeft om elke module te voltooien, en de opgedane kennis te meten door een meerkeuzetoets aan het einde van elke module te geven. Door de gemiddelde voltooiingstijd over alle studenten te berekenen, kunnen we ontdekken welke modules de meeste moeilijkheden veroorzaken voor studenten en werken aan het vereenvoudigen ervan.
+Je zou kunnen beweren dat deze aanpak niet ideaal is, omdat modules verschillende lengtes kunnen hebben. Het is waarschijnlijk eerlijker om de tijd te delen door de lengte van de module (in aantal tekens) en die waarden met elkaar te vergelijken.
+Wanneer we beginnen met het analyseren van de resultaten van meerkeuzetests, kunnen we proberen te bepalen welke concepten studenten moeilijk begrijpen en die informatie gebruiken om de inhoud te verbeteren. Om dat te doen, moeten we tests zo ontwerpen dat elke vraag gekoppeld is aan een bepaald concept of kennisblok.
+
+Als we het nog ingewikkelder willen maken, kunnen we de tijd die nodig is voor elk module vergelijken met de leeftijdscategorie van de studenten. We kunnen ontdekken dat het voor sommige leeftijdscategorieën onevenredig lang duurt om de module te voltooien, of dat studenten afhaken voordat ze deze hebben afgerond. Dit kan ons helpen leeftijdsaanbevelingen voor de module te geven en de ontevredenheid van mensen door verkeerde verwachtingen te minimaliseren.
+
+## 🚀 Uitdaging
+
+In deze uitdaging gaan we proberen concepten te vinden die relevant zijn voor het vakgebied Data Science door naar teksten te kijken. We nemen een Wikipedia-artikel over Data Science, downloaden en verwerken de tekst, en bouwen vervolgens een woordwolk zoals deze:
+
+
+
+Bezoek [`notebook.ipynb`](../../../../../../../../../1-Introduction/01-defining-data-science/notebook.ipynb ':ignore') om de code door te nemen. Je kunt de code ook uitvoeren en zien hoe het alle datatransformaties in real-time uitvoert.
+
+> Als je niet weet hoe je code moet uitvoeren in een Jupyter Notebook, bekijk dan [dit artikel](https://soshnikov.com/education/how-to-execute-notebooks-from-github/).
+
+## [Quiz na de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/1)
+
+## Opdrachten
+
+* **Taak 1**: Pas de bovenstaande code aan om gerelateerde concepten te vinden voor de vakgebieden **Big Data** en **Machine Learning**.
+* **Taak 2**: [Denk na over Data Science-scenario's](assignment.md)
+
+## Credits
+
+Deze les is met ♥️ geschreven door [Dmitry Soshnikov](http://soshnikov.com)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/1-Introduction/01-defining-data-science/assignment.md b/translations/nl/1-Introduction/01-defining-data-science/assignment.md
new file mode 100644
index 00000000..10c6c6c7
--- /dev/null
+++ b/translations/nl/1-Introduction/01-defining-data-science/assignment.md
@@ -0,0 +1,46 @@
+
+# Opdracht: Data Science Scenario's
+
+In deze eerste opdracht vragen we je na te denken over een echt proces of probleem in verschillende probleemdomeinen, en hoe je dit kunt verbeteren met behulp van het Data Science-proces. Denk aan het volgende:
+
+1. Welke data kun je verzamelen?
+1. Hoe zou je deze data verzamelen?
+1. Hoe zou je de data opslaan? Hoe groot zal de data waarschijnlijk zijn?
+1. Welke inzichten kun je uit deze data halen? Welke beslissingen kunnen we nemen op basis van de data?
+
+Probeer na te denken over 3 verschillende problemen/processen en beschrijf elk van de bovenstaande punten voor elk probleemdomein.
+
+Hier zijn enkele probleemdomeinen en problemen om je op weg te helpen:
+
+1. Hoe kun je data gebruiken om het onderwijsproces voor kinderen op scholen te verbeteren?
+1. Hoe kun je data gebruiken om vaccinatie tijdens een pandemie te controleren?
+1. Hoe kun je data gebruiken om ervoor te zorgen dat je productief bent op het werk?
+
+## Instructies
+
+Vul de volgende tabel in (vervang de voorgestelde probleemdomeinen door je eigen ideeën indien nodig):
+
+| Probleemdomein | Probleem | Welke data te verzamelen | Hoe de data op te slaan | Welke inzichten/beslissingen kunnen we maken |
+|----------------|----------|--------------------------|-------------------------|-----------------------------------------------|
+| Onderwijs | | | | |
+| Vaccinatie | | | | |
+| Productiviteit | | | | |
+
+## Beoordelingscriteria
+
+Uitmuntend | Voldoende | Verbetering Nodig
+--- | --- | -- |
+Men was in staat om redelijke databronnen, manieren van dataopslag en mogelijke beslissingen/inzichten voor alle probleemdomeinen te identificeren | Sommige aspecten van de oplossing zijn niet gedetailleerd, dataopslag wordt niet besproken, ten minste 2 probleemdomeinen zijn beschreven | Slechts delen van de datastrategie zijn beschreven, slechts één probleemdomein is overwogen.
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/1-Introduction/01-defining-data-science/solution/assignment.md b/translations/nl/1-Introduction/01-defining-data-science/solution/assignment.md
new file mode 100644
index 00000000..cac37155
--- /dev/null
+++ b/translations/nl/1-Introduction/01-defining-data-science/solution/assignment.md
@@ -0,0 +1,48 @@
+
+# Opdracht: Data Science Scenario's
+
+In deze eerste opdracht vragen we je na te denken over een echt proces of probleem in verschillende domeinen, en hoe je dit kunt verbeteren met behulp van het Data Science-proces. Denk aan het volgende:
+
+1. Welke data kun je verzamelen?
+1. Hoe zou je deze data verzamelen?
+1. Hoe zou je de data opslaan? Hoe groot zal de data waarschijnlijk zijn?
+1. Welke inzichten kun je uit deze data halen? Welke beslissingen kunnen we nemen op basis van de data?
+
+Probeer na te denken over 3 verschillende problemen/processen en beschrijf elk van de bovenstaande punten voor elk probleemdomein.
+
+Hier zijn enkele probleemdomeinen en problemen om je op weg te helpen:
+
+1. Hoe kun je data gebruiken om het onderwijsproces voor kinderen op scholen te verbeteren?
+1. Hoe kun je data gebruiken om vaccinatie tijdens een pandemie te controleren?
+1. Hoe kun je data gebruiken om ervoor te zorgen dat je productief bent op het werk?
+
+## Instructies
+
+Vul de volgende tabel in (vervang de voorgestelde probleemdomeinen door je eigen ideeën indien nodig):
+
+| Probleemdomein | Probleem | Welke data te verzamelen | Hoe de data op te slaan | Welke inzichten/beslissingen we kunnen nemen |
+|----------------|----------|--------------------------|--------------------------|-----------------------------------------------|
+| Onderwijs | Op de universiteit is er doorgaans een lage opkomst bij colleges, en we hebben de hypothese dat studenten die colleges bijwonen gemiddeld beter presteren tijdens examens. We willen de opkomst stimuleren en de hypothese testen. | We kunnen de aanwezigheid bijhouden via foto's die door de beveiligingscamera in de klas worden gemaakt, of door bluetooth/wifi-adressen van mobiele telefoons van studenten in de klas te volgen. Examendata is al beschikbaar in de universiteitsdatabase. | Als we beveiligingscamera-afbeeldingen volgen, moeten we een paar (5-10) foto's tijdens de les opslaan (ongestructureerde data) en vervolgens AI gebruiken om gezichten van studenten te identificeren (data omzetten naar gestructureerde vorm). | We kunnen gemiddelde aanwezigheidsdata voor elke student berekenen en kijken of er een correlatie is met examencijfers. We zullen meer over correlatie bespreken in de sectie [kansrekening en statistiek](../../04-stats-and-probability/README.md). Om de aanwezigheid van studenten te stimuleren, kunnen we de wekelijkse aanwezigheidsranglijst publiceren op het schoolportaal en prijzen verloten onder degenen met de hoogste aanwezigheid. |
+| Vaccinatie | | | | |
+| Productiviteit | | | | |
+
+> *We geven slechts één antwoord als voorbeeld, zodat je een idee krijgt van wat er van je wordt verwacht in deze opdracht.*
+
+## Beoordelingscriteria
+
+Uitmuntend | Voldoende | Verbetering Nodig
+--- | --- | -- |
+Men was in staat om redelijke databronnen, manieren van dataopslag en mogelijke beslissingen/inzichten voor alle probleemdomeinen te identificeren | Sommige aspecten van de oplossing zijn niet gedetailleerd, dataopslag wordt niet besproken, ten minste 2 probleemdomeinen zijn beschreven | Slechts delen van de datastructuur zijn beschreven, slechts één probleemdomein is overwogen.
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/1-Introduction/02-ethics/README.md b/translations/nl/1-Introduction/02-ethics/README.md
new file mode 100644
index 00000000..e130e6d0
--- /dev/null
+++ b/translations/nl/1-Introduction/02-ethics/README.md
@@ -0,0 +1,269 @@
+
+# Introductie tot Data-ethiek
+
+| ](../../sketchnotes/02-Ethics.png)|
+|:---:|
+| Data Science Ethiek - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+---
+
+We zijn allemaal databurgers die leven in een wereld vol data.
+
+Markttrends voorspellen dat tegen 2022, 1 op de 3 grote organisaties hun data zal kopen en verkopen via online [marktplaatsen en beurzen](https://www.gartner.com/smarterwithgartner/gartner-top-10-trends-in-data-and-analytics-for-2020/). Als **app-ontwikkelaars** wordt het voor ons eenvoudiger en goedkoper om datagestuurde inzichten en algoritmegestuurde automatisering te integreren in dagelijkse gebruikerservaringen. Maar naarmate AI alomtegenwoordig wordt, moeten we ook de potentiële schade begrijpen die kan worden veroorzaakt door de [bewapening](https://www.youtube.com/watch?v=TQHs8SA1qpk) van dergelijke algoritmen op grote schaal.
+
+Trends geven ook aan dat we tegen 2025 meer dan [180 zettabytes](https://www.statista.com/statistics/871513/worldwide-data-created/) aan data zullen creëren en consumeren. Als **datawetenschappers** geeft dit ons ongekende toegang tot persoonlijke gegevens. Dit betekent dat we gedragsprofielen van gebruikers kunnen opstellen en besluitvorming kunnen beïnvloeden op manieren die een [illusie van vrije keuze](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) creëren, terwijl we gebruikers mogelijk naar door ons gewenste uitkomsten sturen. Dit roept ook bredere vragen op over gegevensprivacy en gebruikersbescherming.
+
+Data-ethiek is nu een _noodzakelijke leidraad_ voor datawetenschap en engineering, die ons helpt potentiële schade en onbedoelde gevolgen van onze datagestuurde acties te minimaliseren. De [Gartner Hype Cycle voor AI](https://www.gartner.com/smarterwithgartner/2-megatrends-dominate-the-gartner-hype-cycle-for-artificial-intelligence-2020/) identificeert relevante trends in digitale ethiek, verantwoordelijke AI en AI-governance als belangrijke drijfveren voor grotere megatrends rond _democratisering_ en _industrialisering_ van AI.
+
+
+
+In deze les verkennen we het fascinerende gebied van data-ethiek - van kernconcepten en uitdagingen tot casestudies en toegepaste AI-concepten zoals governance - die helpen een ethische cultuur te vestigen in teams en organisaties die met data en AI werken.
+
+## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/2) 🎯
+
+## Basisdefinities
+
+Laten we beginnen met het begrijpen van de basisterminologie.
+
+Het woord "ethiek" komt van het [Griekse woord "ethikos"](https://en.wikipedia.org/wiki/Ethics) (en de wortel "ethos") wat _karakter of morele aard_ betekent.
+
+**Ethiek** gaat over de gedeelde waarden en morele principes die ons gedrag in de samenleving sturen. Ethiek is niet gebaseerd op wetten, maar op algemeen geaccepteerde normen van wat "goed versus fout" is. Echter, ethische overwegingen kunnen invloed hebben op initiatieven voor corporate governance en overheidsreguleringen die meer prikkels creëren voor naleving.
+
+**Data-ethiek** is een [nieuwe tak van ethiek](https://royalsocietypublishing.org/doi/full/10.1098/rsta.2016.0360#sec-1) die "morele problemen bestudeert en evalueert met betrekking tot _data, algoritmen en bijbehorende praktijken_". Hier richt **"data"** zich op acties zoals generatie, registratie, curatie, verwerking, verspreiding, delen en gebruik; **"algoritmen"** op AI, agenten, machine learning en robots; en **"praktijken"** op onderwerpen zoals verantwoord innoveren, programmeren, hacken en ethische codes.
+
+**Toegepaste ethiek** is de [praktische toepassing van morele overwegingen](https://en.wikipedia.org/wiki/Applied_ethics). Het is het proces van actief onderzoeken van ethische kwesties in de context van _real-world acties, producten en processen_, en het nemen van corrigerende maatregelen om ervoor te zorgen dat deze in lijn blijven met onze gedefinieerde ethische waarden.
+
+**Ethiekcultuur** gaat over het [_operationeel maken_ van toegepaste ethiek](https://hbr.org/2019/05/how-to-design-an-ethical-organization) om ervoor te zorgen dat onze ethische principes en praktijken consistent en schaalbaar worden toegepast in de hele organisatie. Succesvolle ethiekculturen definiëren organisatiebrede ethische principes, bieden zinvolle prikkels voor naleving en versterken ethische normen door gewenst gedrag op elk niveau van de organisatie aan te moedigen en te versterken.
+
+## Ethiekconcepten
+
+In deze sectie bespreken we concepten zoals **gedeelde waarden** (principes) en **ethische uitdagingen** (problemen) voor data-ethiek - en verkennen we **casestudies** die je helpen deze concepten te begrijpen in real-world contexten.
+
+### 1. Ethiekprincipes
+
+Elke data-ethiekstrategie begint met het definiëren van _ethische principes_ - de "gedeelde waarden" die acceptabel gedrag beschrijven en compliant acties sturen in onze data- en AI-projecten. Je kunt deze definiëren op individueel of teamniveau. Echter, de meeste grote organisaties schetsen deze in een _ethische AI_-missieverklaring of raamwerk dat op bedrijfsniveau wordt gedefinieerd en consistent wordt gehandhaafd in alle teams.
+
+**Voorbeeld:** De [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai)-missieverklaring van Microsoft luidt: _"We zijn toegewijd aan de vooruitgang van AI, gedreven door ethische principes die mensen op de eerste plaats zetten"_ - met daarin 6 ethische principes zoals hieronder weergegeven:
+
+
+
+Laten we deze principes kort verkennen. _Transparantie_ en _verantwoordelijkheid_ zijn fundamentele waarden waarop andere principes zijn gebaseerd - dus laten we daar beginnen:
+
+* [**Verantwoordelijkheid**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) maakt beoefenaars _verantwoordelijk_ voor hun data- en AI-operaties en naleving van deze ethische principes.
+* [**Transparantie**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zorgt ervoor dat data- en AI-acties _begrijpelijk_ (interpreteerbaar) zijn voor gebruikers, waarbij wordt uitgelegd wat en waarom beslissingen worden genomen.
+* [**Eerlijkheid**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) richt zich op het waarborgen dat AI _alle mensen_ eerlijk behandelt, en eventuele systemische of impliciete sociaal-technische vooroordelen in data en systemen aanpakt.
+* [**Betrouwbaarheid & Veiligheid**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) zorgt ervoor dat AI zich _consistent_ gedraagt met gedefinieerde waarden, en potentiële schade of onbedoelde gevolgen minimaliseert.
+* [**Privacy & Beveiliging**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) gaat over het begrijpen van de herkomst van data en het bieden van _gegevensprivacy en gerelateerde bescherming_ aan gebruikers.
+* [**Inclusiviteit**](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1:primaryr6) gaat over het intentioneel ontwerpen van AI-oplossingen en deze aanpassen om te voldoen aan een _breed scala aan menselijke behoeften_ en capaciteiten.
+
+> 🚨 Denk na over wat jouw data-ethiek missieverklaring zou kunnen zijn. Verken ethische AI-raamwerken van andere organisaties - hier zijn voorbeelden van [IBM](https://www.ibm.com/cloud/learn/ai-ethics), [Google](https://ai.google/principles), en [Facebook](https://ai.facebook.com/blog/facebooks-five-pillars-of-responsible-ai/). Welke gedeelde waarden hebben ze gemeen? Hoe relateren deze principes aan het AI-product of de industrie waarin ze opereren?
+
+### 2. Ethiekuitdagingen
+
+Zodra we ethische principes hebben gedefinieerd, is de volgende stap om onze data- en AI-acties te evalueren om te zien of ze in lijn zijn met die gedeelde waarden. Denk aan je acties in twee categorieën: _dataverzameling_ en _algoritmeontwerp_.
+
+Bij dataverzameling zullen acties waarschijnlijk betrekking hebben op **persoonlijke gegevens** of persoonlijk identificeerbare informatie (PII) van identificeerbare levende individuen. Dit omvat [diverse items van niet-persoonlijke gegevens](https://ec.europa.eu/info/law/law-topic/data-protection/reform/what-personal-data_en) die _gezamenlijk_ een individu identificeren. Ethische uitdagingen kunnen betrekking hebben op _gegevensprivacy_, _gegevensbezit_ en gerelateerde onderwerpen zoals _geïnformeerde toestemming_ en _intellectuele eigendomsrechten_ voor gebruikers.
+
+Bij algoritmeontwerp zullen acties betrekking hebben op het verzamelen en samenstellen van **datasets**, en deze vervolgens gebruiken om **datamodellen** te trainen en in te zetten die uitkomsten voorspellen of beslissingen automatiseren in real-world contexten. Ethische uitdagingen kunnen voortkomen uit _datasetbias_, _gegevenskwaliteit_ problemen, _oneerlijkheid_ en _verkeerde voorstelling_ in algoritmen - inclusief enkele problemen die systemisch van aard zijn.
+
+In beide gevallen benadrukken ethische uitdagingen gebieden waar onze acties mogelijk in conflict komen met onze gedeelde waarden. Om deze zorgen te detecteren, te beperken, te minimaliseren of te elimineren, moeten we morele "ja/nee"-vragen stellen met betrekking tot onze acties en vervolgens corrigerende maatregelen nemen indien nodig. Laten we enkele ethische uitdagingen en de morele vragen die ze oproepen bekijken:
+
+#### 2.1 Gegevensbezit
+
+Dataverzameling omvat vaak persoonlijke gegevens die de betrokkenen kunnen identificeren. [Gegevensbezit](https://permission.io/blog/data-ownership) gaat over _controle_ en [_gebruikersrechten_](https://permission.io/blog/data-ownership) met betrekking tot de creatie, verwerking en verspreiding van gegevens.
+
+De morele vragen die we moeten stellen zijn:
+ * Wie bezit de gegevens? (gebruiker of organisatie)
+ * Welke rechten hebben betrokkenen? (bijv. toegang, verwijdering, overdraagbaarheid)
+ * Welke rechten hebben organisaties? (bijv. rectificatie van schadelijke gebruikersbeoordelingen)
+
+#### 2.2 Geïnformeerde Toestemming
+
+[Geïnformeerde toestemming](https://legaldictionary.net/informed-consent/) definieert de handeling waarbij gebruikers instemmen met een actie (zoals dataverzameling) met een _volledig begrip_ van relevante feiten, inclusief het doel, de potentiële risico's en alternatieven.
+
+Vragen om hier te onderzoeken zijn:
+ * Heeft de gebruiker (betrokkene) toestemming gegeven voor gegevensverzameling en -gebruik?
+ * Begrijpt de gebruiker het doel waarvoor die gegevens zijn verzameld?
+ * Begrijpt de gebruiker de potentiële risico's van hun deelname?
+
+#### 2.3 Intellectuele Eigendom
+
+[Intellectuele eigendom](https://en.wikipedia.org/wiki/Intellectual_property) verwijst naar immateriële creaties die voortkomen uit menselijke initiatieven en mogelijk _economische waarde_ hebben voor individuen of bedrijven.
+
+Vragen om hier te onderzoeken zijn:
+ * Hadden de verzamelde gegevens economische waarde voor een gebruiker of bedrijf?
+ * Heeft de **gebruiker** hier intellectuele eigendom?
+ * Heeft de **organisatie** hier intellectuele eigendom?
+ * Als deze rechten bestaan, hoe beschermen we ze?
+
+#### 2.4 Gegevensprivacy
+
+[Gegevensprivacy](https://www.northeastern.edu/graduate/blog/what-is-data-privacy/) of informatieprivacy verwijst naar het behoud van gebruikersprivacy en de bescherming van gebruikersidentiteit met betrekking tot persoonlijk identificeerbare informatie.
+
+Vragen om hier te onderzoeken zijn:
+ * Zijn de (persoonlijke) gegevens van gebruikers beveiligd tegen hacks en lekken?
+ * Zijn de gegevens van gebruikers alleen toegankelijk voor geautoriseerde gebruikers en contexten?
+ * Wordt de anonimiteit van gebruikers behouden wanneer gegevens worden gedeeld of verspreid?
+ * Kan een gebruiker worden gedeïdentificeerd uit geanonimiseerde datasets?
+
+#### 2.5 Recht Om Vergeten Te Worden
+
+Het [Recht Om Vergeten Te Worden](https://en.wikipedia.org/wiki/Right_to_be_forgotten) of [Recht op Verwijdering](https://www.gdpreu.org/right-to-be-forgotten/) biedt extra bescherming van persoonlijke gegevens aan gebruikers. Het geeft gebruikers specifiek het recht om verwijdering of verwijdering van persoonlijke gegevens te verzoeken uit internetzoekopdrachten en andere locaties, _onder specifieke omstandigheden_ - zodat ze een nieuwe start online kunnen maken zonder dat eerdere acties tegen hen worden gebruikt.
+
+Vragen om hier te onderzoeken zijn:
+ * Staat het systeem toe dat betrokkenen verwijdering aanvragen?
+ * Moet het intrekken van gebruikersinstemming automatische verwijdering activeren?
+ * Zijn gegevens verzameld zonder toestemming of op onwettige wijze?
+ * Voldoen we aan overheidsvoorschriften voor gegevensprivacy?
+
+#### 2.6 Datasetbias
+
+Dataset- of [verzamelbias](http://researcharticles.com/index.php/bias-in-data-collection-in-research/) gaat over het selecteren van een _niet-representatieve_ subset van gegevens voor algoritmeontwikkeling, wat mogelijk oneerlijkheid creëert in uitkomsten voor diverse groepen. Soorten bias omvatten selectie- of steekproefbias, vrijwillige bias en instrumentbias.
+
+Vragen om hier te onderzoeken zijn:
+ * Hebben we een representatieve set betrokkenen geworven?
+ * Hebben we onze verzamelde of samengestelde dataset getest op verschillende vormen van bias?
+ * Kunnen we ontdekte bias beperken of verwijderen?
+
+#### 2.7 Gegevenskwaliteit
+
+[Gegevenskwaliteit](https://lakefs.io/data-quality-testing/) kijkt naar de geldigheid van de samengestelde dataset die wordt gebruikt om onze algoritmen te ontwikkelen, en controleert of kenmerken en records voldoen aan de vereisten voor het niveau van nauwkeurigheid en consistentie dat nodig is voor ons AI-doel.
+
+Vragen om hier te onderzoeken zijn:
+ * Hebben we geldige _kenmerken_ vastgelegd voor ons gebruiksscenario?
+ * Zijn gegevens _consistent_ vastgelegd over diverse gegevensbronnen?
+ * Is de dataset _volledig_ voor diverse omstandigheden of scenario's?
+ * Is informatie _nauwkeurig_ vastgelegd in het weergeven van de werkelijkheid?
+
+#### 2.8 Algoritmische Eerlijkheid
+[Algorithmische Eerlijkheid](https://towardsdatascience.com/what-is-algorithm-fairness-3182e161cf9f) onderzoekt of het ontwerp van een algoritme systematisch discrimineert tegen specifieke subgroepen van betrokkenen, wat kan leiden tot [potentiële schade](https://docs.microsoft.com/en-us/azure/machine-learning/concept-fairness-ml) in _toewijzing_ (waar middelen worden geweigerd of onthouden aan die groep) en _kwaliteit van dienstverlening_ (waar AI minder nauwkeurig is voor sommige subgroepen dan voor anderen).
+
+Vragen om hier te onderzoeken zijn:
+ * Hebben we de nauwkeurigheid van het model geëvalueerd voor diverse subgroepen en omstandigheden?
+ * Hebben we het systeem onderzocht op potentiële schade (bijv. stereotypering)?
+ * Kunnen we gegevens herzien of modellen opnieuw trainen om geïdentificeerde schade te verminderen?
+
+Verken bronnen zoals [AI Fairness checklists](https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4t6dA) om meer te leren.
+
+#### 2.9 Misrepresentatie
+
+[Data Misrepresentatie](https://www.sciencedirect.com/topics/computer-science/misrepresentation) gaat over de vraag of we inzichten uit eerlijk gerapporteerde gegevens op een misleidende manier communiceren om een gewenst narratief te ondersteunen.
+
+Vragen om hier te onderzoeken zijn:
+ * Rapporteren we onvolledige of onnauwkeurige gegevens?
+ * Visualiseren we gegevens op een manier die misleidende conclusies stimuleert?
+ * Gebruiken we selectieve statistische technieken om uitkomsten te manipuleren?
+ * Zijn er alternatieve verklaringen die een andere conclusie kunnen bieden?
+
+#### 2.10 Vrije Keuze
+De [Illusie van Vrije Keuze](https://www.datasciencecentral.com/profiles/blogs/the-illusion-of-choice) ontstaat wanneer "keuze-architecturen" van systemen besluitvormingsalgoritmen gebruiken om mensen subtiel te sturen naar een voorkeursuitkomst, terwijl ze hen opties en controle lijken te geven. Deze [dark patterns](https://www.darkpatterns.org/) kunnen sociale en economische schade veroorzaken voor gebruikers. Omdat gebruikersbeslissingen gedragspatronen beïnvloeden, kunnen deze acties toekomstige keuzes sturen en de impact van deze schade versterken of verlengen.
+
+Vragen om hier te onderzoeken zijn:
+ * Begrijpt de gebruiker de implicaties van het maken van die keuze?
+ * Is de gebruiker zich bewust van (alternatieve) keuzes en de voor- en nadelen van elke keuze?
+ * Kan de gebruiker een geautomatiseerde of beïnvloede keuze later terugdraaien?
+
+### 3. Casestudies
+
+Om deze ethische uitdagingen in een realistische context te plaatsen, helpt het om casestudies te bekijken die de potentiële schade en gevolgen voor individuen en de samenleving benadrukken wanneer dergelijke ethische schendingen over het hoofd worden gezien.
+
+Hier zijn enkele voorbeelden:
+
+| Ethische Uitdaging | Casestudy |
+|--- |--- |
+| **Informed Consent** | 1972 - [Tuskegee Syphilis Study](https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study) - Afro-Amerikaanse mannen die deelnamen aan de studie kregen gratis medische zorg beloofd _maar werden misleid_ door onderzoekers die hen niet informeerden over hun diagnose of de beschikbaarheid van behandeling. Veel deelnemers stierven en hun partners of kinderen werden getroffen; de studie duurde 40 jaar. |
+| **Data Privacy** | 2007 - De [Netflix data prize](https://www.wired.com/2007/12/why-anonymous-data-sometimes-isnt/) bood onderzoekers _10M geanonimiseerde filmbeoordelingen van 50K klanten_ om aanbevelingsalgoritmen te verbeteren. Onderzoekers konden echter geanonimiseerde gegevens correleren met persoonlijk identificeerbare gegevens in _externe datasets_ (bijv. IMDb-commentaren), waardoor sommige Netflix-abonnees effectief "gedeanonimiseerd" werden.|
+| **Collection Bias** | 2013 - De stad Boston [ontwikkelde Street Bump](https://www.boston.gov/transportation/street-bump), een app waarmee burgers kuilen konden melden, zodat de stad betere gegevens kreeg om problemen op de weg te vinden en op te lossen. Echter, [mensen in lagere inkomensgroepen hadden minder toegang tot auto's en telefoons](https://hbr.org/2013/04/the-hidden-biases-in-big-data), waardoor hun wegproblemen onzichtbaar werden in deze app. Ontwikkelaars werkten samen met academici om _gelijke toegang en digitale kloof_ kwesties aan te pakken voor eerlijkheid. |
+| **Algorithmische Eerlijkheid** | 2018 - De MIT [Gender Shades Study](http://gendershades.org/overview.html) evalueerde de nauwkeurigheid van AI-producten voor geslachtsclassificatie en onthulde hiaten in nauwkeurigheid voor vrouwen en mensen van kleur. Een [2019 Apple Card](https://www.wired.com/story/the-apple-card-didnt-see-genderand-thats-the-problem/) leek minder krediet te bieden aan vrouwen dan aan mannen. Beide illustreerden problemen in algoritmische bias die socio-economische schade veroorzaakten.|
+| **Data Misrepresentatie** | 2020 - Het [Georgia Department of Public Health publiceerde COVID-19 grafieken](https://www.vox.com/covid-19-coronavirus-us-response-trump/2020/5/18/21262265/georgia-covid-19-cases-declining-reopening) die burgers leken te misleiden over trends in bevestigde gevallen met niet-chronologische ordening op de x-as. Dit illustreert misrepresentatie door visualisatietrucs. |
+| **Illusie van vrije keuze** | 2020 - Leerapp [ABCmouse betaalde $10M om een FTC-klacht te schikken](https://www.washingtonpost.com/business/2020/09/04/abcmouse-10-million-ftc-settlement/) waarbij ouders werden vastgezet in abonnementen die ze niet konden annuleren. Dit illustreert dark patterns in keuze-architecturen, waarbij gebruikers werden gestuurd naar potentieel schadelijke keuzes. |
+| **Data Privacy & Gebruikersrechten** | 2021 - Facebook [Data Breach](https://www.npr.org/2021/04/09/986005820/after-data-breach-exposes-530-million-facebook-says-it-will-not-notify-users) onthulde gegevens van 530M gebruikers, wat resulteerde in een $5B schikking met de FTC. Het weigerde echter gebruikers te informeren over de schending, wat inbreuk maakte op gebruikersrechten rond gegevens transparantie en toegang. |
+
+Wil je meer casestudies verkennen? Bekijk deze bronnen:
+* [Ethics Unwrapped](https://ethicsunwrapped.utexas.edu/case-studies) - ethische dilemma's in diverse industrieën.
+* [Data Science Ethics course](https://www.coursera.org/learn/data-science-ethics#syllabus) - landmark casestudies onderzocht.
+* [Waar dingen fout zijn gegaan](https://deon.drivendata.org/examples/) - deon checklist met voorbeelden.
+
+
+> 🚨 Denk na over de casestudies die je hebt gezien - heb je een soortgelijke ethische uitdaging in je leven ervaren of ondervonden? Kun je minstens één andere casestudy bedenken die een van de ethische uitdagingen illustreert die we in deze sectie hebben besproken?
+
+## Toegepaste Ethiek
+
+We hebben gesproken over ethische concepten, uitdagingen en casestudies in realistische contexten. Maar hoe beginnen we met het _toepassen_ van ethische principes en praktijken in onze projecten? En hoe _operationeel maken_ we deze praktijken voor betere governance? Laten we enkele praktische oplossingen verkennen:
+
+### 1. Professionele Codes
+
+Professionele codes bieden een optie voor organisaties om leden te "stimuleren" om hun ethische principes en missieverklaring te ondersteunen. Codes zijn _morele richtlijnen_ voor professioneel gedrag, die werknemers of leden helpen beslissingen te nemen die in lijn zijn met de principes van hun organisatie. Ze zijn alleen zo goed als de vrijwillige naleving door leden; veel organisaties bieden echter aanvullende beloningen en straffen om naleving te motiveren.
+
+Voorbeelden zijn:
+
+ * [Oxford Munich](http://www.code-of-ethics.org/code-of-conduct/) Code of Ethics
+ * [Data Science Association](http://datascienceassn.org/code-of-conduct.html) Code of Conduct (gemaakt in 2013)
+ * [ACM Code of Ethics and Professional Conduct](https://www.acm.org/code-of-ethics) (sinds 1993)
+
+> 🚨 Behoor je tot een professionele ingenieurs- of data science-organisatie? Verken hun site om te zien of ze een professionele ethische code definiëren. Wat zegt dit over hun ethische principes? Hoe stimuleren ze leden om de code te volgen?
+
+### 2. Ethiek Checklists
+
+Hoewel professionele codes vereist _ethisch gedrag_ van beoefenaars definiëren, hebben ze [bekende beperkingen](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md) in handhaving, vooral in grootschalige projecten. In plaats daarvan pleiten veel data science-experts [voor checklists](https://resources.oreilly.com/examples/0636920203964/blob/master/of_oaths_and_checklists.md), die **principes verbinden met praktijken** op meer deterministische en actiegerichte manieren.
+
+Checklists zetten vragen om in "ja/nee"-taken die operationeel kunnen worden gemaakt, waardoor ze kunnen worden gevolgd als onderdeel van standaard productrelease-workflows.
+
+Voorbeelden zijn:
+ * [Deon](https://deon.drivendata.org/) - een algemene data ethiek checklist gemaakt op basis van [industrie aanbevelingen](https://deon.drivendata.org/#checklist-citations) met een command-line tool voor eenvoudige integratie.
+ * [Privacy Audit Checklist](https://cyber.harvard.edu/ecommerce/privacyaudit.html) - biedt algemene richtlijnen voor informatieverwerkingspraktijken vanuit juridische en sociale blootstellingsperspectieven.
+ * [AI Fairness Checklist](https://www.microsoft.com/en-us/research/project/ai-fairness-checklist/) - gemaakt door AI-practitioners om de adoptie en integratie van eerlijkheidscontroles in AI-ontwikkelingscycli te ondersteunen.
+ * [22 vragen voor ethiek in data en AI](https://medium.com/the-organization/22-questions-for-ethics-in-data-and-ai-efb68fd19429) - een meer open framework, gestructureerd voor initiële verkenning van ethische kwesties in ontwerp, implementatie en organisatorische contexten.
+
+### 3. Ethiek Regels
+
+Ethiek gaat over het definiëren van gedeelde waarden en vrijwillig het juiste doen. **Naleving** gaat over _het volgen van de wet_ waar en indien gedefinieerd. **Governance** omvat in brede zin alle manieren waarop organisaties opereren om ethische principes te handhaven en te voldoen aan vastgestelde wetten.
+
+Vandaag de dag neemt governance twee vormen aan binnen organisaties. Ten eerste gaat het om het definiëren van **ethische AI**-principes en het vaststellen van praktijken om adoptie te operationaliseren in alle AI-gerelateerde projecten binnen de organisatie. Ten tweede gaat het om naleving van alle door de overheid opgelegde **gegevensbeschermingsregels** voor regio's waarin het opereert.
+
+Voorbeelden van gegevensbeschermings- en privacyregels:
+
+ * `1974`, [US Privacy Act](https://www.justice.gov/opcl/privacy-act-1974) - reguleert _federale overheid_ verzameling, gebruik en openbaarmaking van persoonlijke informatie.
+ * `1996`, [US Health Insurance Portability & Accountability Act (HIPAA)](https://www.cdc.gov/phlp/publications/topic/hipaa.html) - beschermt persoonlijke gezondheidsgegevens.
+ * `1998`, [US Children's Online Privacy Protection Act (COPPA)](https://www.ftc.gov/enforcement/rules/rulemaking-regulatory-reform-proceedings/childrens-online-privacy-protection-rule) - beschermt gegevensprivacy van kinderen onder de 13.
+ * `2018`, [General Data Protection Regulation (GDPR)](https://gdpr-info.eu/) - biedt gebruikersrechten, gegevensbescherming en privacy.
+ * `2018`, [California Consumer Privacy Act (CCPA)](https://www.oag.ca.gov/privacy/ccpa) geeft consumenten meer _rechten_ over hun (persoonlijke) gegevens.
+ * `2021`, China's [Personal Information Protection Law](https://www.reuters.com/world/china/china-passes-new-personal-data-privacy-law-take-effect-nov-1-2021-08-20/) net aangenomen, een van de sterkste online gegevensprivacyregels wereldwijd.
+
+> 🚨 De Europese Unie definieerde GDPR (General Data Protection Regulation) blijft een van de meest invloedrijke gegevensprivacyregels vandaag. Wist je dat het ook [8 gebruikersrechten](https://www.freeprivacypolicy.com/blog/8-user-rights-gdpr) definieert om de digitale privacy en persoonlijke gegevens van burgers te beschermen? Leer wat deze zijn en waarom ze belangrijk zijn.
+
+
+### 4. Ethiek Cultuur
+
+Let op dat er een ontastbare kloof blijft tussen _naleving_ (genoeg doen om "de letter van de wet" te volgen) en het aanpakken van [systemische problemen](https://www.coursera.org/learn/data-science-ethics/home/week/4) (zoals verstening, informatie-asymmetrie en distributionele oneerlijkheid) die de wapenisering van AI kunnen versnellen.
+
+Het laatste vereist [samenwerkingsbenaderingen om ethiekculturen te definiëren](https://towardsdatascience.com/why-ai-ethics-requires-a-culture-driven-approach-26f451afa29f) die emotionele verbindingen en consistente gedeelde waarden _tussen organisaties_ in de industrie opbouwen. Dit vraagt om meer [geformaliseerde data ethiek culturen](https://www.codeforamerica.org/news/formalizing-an-ethical-data-culture/) in organisaties - waardoor _iedereen_ [de Andon-kabel kan trekken](https://en.wikipedia.org/wiki/Andon_(manufacturing)) (om ethische zorgen vroeg in het proces aan te kaarten) en _ethische beoordelingen_ (bijv. bij werving) een kerncriterium maken voor teamvorming in AI-projecten.
+
+---
+## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/3) 🎯
+## Review & Zelfstudie
+
+Cursussen en boeken helpen bij het begrijpen van kernconcepten en uitdagingen in ethiek, terwijl casestudies en tools helpen bij toegepaste ethiekpraktijken in realistische contexten. Hier zijn enkele bronnen om mee te beginnen.
+
+* [Machine Learning For Beginners](https://github.com/microsoft/ML-For-Beginners/blob/main/1-Introduction/3-fairness/README.md) - les over eerlijkheid, van Microsoft.
+* [Principes van Verantwoordelijke AI](https://docs.microsoft.com/en-us/learn/modules/responsible-ai-principles/) - gratis leerpad van Microsoft Learn.
+* [Ethiek en Datawetenschap](https://resources.oreilly.com/examples/0636920203964) - O'Reilly EBook (M. Loukides, H. Mason et. al)
+* [Ethiek in Datawetenschap](https://www.coursera.org/learn/data-science-ethics#syllabus) - online cursus van de Universiteit van Michigan.
+* [Ethiek Ontrafeld](https://ethicsunwrapped.utexas.edu/case-studies) - casestudies van de Universiteit van Texas.
+
+# Opdracht
+
+[Schrijf Een Casestudy Over Data-Ethiek](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/1-Introduction/02-ethics/assignment.md b/translations/nl/1-Introduction/02-ethics/assignment.md
new file mode 100644
index 00000000..0e179ff0
--- /dev/null
+++ b/translations/nl/1-Introduction/02-ethics/assignment.md
@@ -0,0 +1,35 @@
+
+## Schrijf Een Casestudy Over Data-ethiek
+
+## Instructies
+
+Je hebt geleerd over verschillende [Uitdagingen in Data-ethiek](README.md#2-ethics-challenges) en voorbeelden gezien van [Casestudy's](README.md#3-case-studies) die uitdagingen in data-ethiek in realistische contexten weerspiegelen.
+
+In deze opdracht schrijf je je eigen casestudy over een uitdaging in data-ethiek, gebaseerd op je eigen ervaring of een relevante realistische context waarmee je bekend bent. Volg gewoon deze stappen:
+
+1. `Kies een uitdaging in data-ethiek`. Bekijk [de voorbeelden uit de les](README.md#2-ethics-challenges) of zoek online naar inspiratie, zoals [de Deon Checklist](https://deon.drivendata.org/examples/).
+
+2. `Beschrijf een voorbeeld uit de echte wereld`. Denk aan een situatie waar je over hebt gehoord (nieuwsberichten, onderzoeksstudie, etc.) of die je hebt meegemaakt (lokale gemeenschap), waarin deze specifieke uitdaging voorkwam. Denk na over de vragen rond data-ethiek die met de uitdaging te maken hebben en bespreek de mogelijke schade of onbedoelde gevolgen die door dit probleem ontstaan. Bonuspunten: bedenk mogelijke oplossingen of processen die hier kunnen worden toegepast om de negatieve impact van deze uitdaging te verminderen of te voorkomen.
+
+3. `Geef een lijst met gerelateerde bronnen`. Deel een of meer bronnen (links naar een artikel, een persoonlijke blogpost of afbeelding, online onderzoeksrapport, etc.) om te bewijzen dat dit echt is gebeurd. Bonuspunten: deel bronnen die ook de mogelijke schade en gevolgen van het incident laten zien, of positieve stappen benadrukken die zijn genomen om herhaling te voorkomen.
+
+
+
+## Rubriek
+
+Uitmuntend | Voldoende | Verbetering Nodig
+--- | --- | -- |
+Een of meer uitdagingen in data-ethiek worden geïdentificeerd.
De casestudy beschrijft duidelijk een incident uit de echte wereld dat deze uitdaging weerspiegelt en benadrukt de ongewenste gevolgen of schade die het heeft veroorzaakt.
Er is ten minste één gelinkte bron om te bewijzen dat dit is gebeurd. | Eén uitdaging in data-ethiek wordt geïdentificeerd.
Ten minste één relevante schade of gevolg wordt kort besproken.
De discussie is echter beperkt of mist bewijs van een gebeurtenis in de echte wereld. | Een uitdaging in data-ethiek wordt geïdentificeerd.
De beschrijving of bronnen weerspiegelen echter niet voldoende de uitdaging of bewijzen niet dat het in de echte wereld is gebeurd. |
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/1-Introduction/03-defining-data/README.md b/translations/nl/1-Introduction/03-defining-data/README.md
new file mode 100644
index 00000000..512e9cf9
--- /dev/null
+++ b/translations/nl/1-Introduction/03-defining-data/README.md
@@ -0,0 +1,84 @@
+
+# Data Definiëren
+
+| ](../../sketchnotes/03-DefiningData.png)|
+|:---:|
+|Data Definiëren - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+Data zijn feiten, informatie, observaties en metingen die worden gebruikt om ontdekkingen te doen en om weloverwogen beslissingen te ondersteunen. Een datapunt is een enkele eenheid van data binnen een dataset, wat een verzameling van datapunten is. Datasets kunnen in verschillende formaten en structuren voorkomen en zijn meestal gebaseerd op de bron, of waar de data vandaan komt. Bijvoorbeeld, de maandelijkse inkomsten van een bedrijf kunnen in een spreadsheet staan, terwijl gegevens over de hartslag per uur van een smartwatch in [JSON](https://stackoverflow.com/a/383699)-formaat kunnen zijn. Het is gebruikelijk dat datawetenschappers met verschillende soorten data binnen een dataset werken.
+
+Deze les richt zich op het identificeren en classificeren van data op basis van de kenmerken en bronnen ervan.
+
+## [Pre-Lecture Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/4)
+## Hoe Data Wordt Beschreven
+
+### Ruwe Data
+Ruwe data is data die afkomstig is van de bron in zijn oorspronkelijke staat en nog niet is geanalyseerd of georganiseerd. Om te begrijpen wat er met een dataset gebeurt, moet deze worden georganiseerd in een formaat dat begrijpelijk is voor mensen en de technologie die ze mogelijk gebruiken om het verder te analyseren. De structuur van een dataset beschrijft hoe deze is georganiseerd en kan worden geclassificeerd als gestructureerd, ongestructureerd en semi-gestructureerd. Deze structuren variëren afhankelijk van de bron, maar vallen uiteindelijk in een van deze drie categorieën.
+
+### Kwantitatieve Data
+Kwantitatieve data zijn numerieke observaties binnen een dataset en kunnen doorgaans worden geanalyseerd, gemeten en wiskundig gebruikt. Enkele voorbeelden van kwantitatieve data zijn: de bevolking van een land, de lengte van een persoon of de kwartaalinkomsten van een bedrijf. Met aanvullende analyses kan kwantitatieve data worden gebruikt om seizoensgebonden trends in de luchtkwaliteitsindex (AQI) te ontdekken of de kans op spitsverkeer op een typische werkdag te schatten.
+
+### Kwalitatieve Data
+Kwalitatieve data, ook wel categorische data genoemd, is data die niet objectief kan worden gemeten zoals kwantitatieve data. Het is over het algemeen subjectieve data in verschillende formaten die de kwaliteit van iets vastleggen, zoals een product of proces. Soms is kwalitatieve data numeriek, maar wordt het niet wiskundig gebruikt, zoals telefoonnummers of tijdstempels. Enkele voorbeelden van kwalitatieve data zijn: videocommentaren, het merk en model van een auto of de favoriete kleur van je beste vrienden. Kwalitatieve data kan worden gebruikt om te begrijpen welke producten consumenten het beste vinden of om populaire trefwoorden in sollicitatieresumes te identificeren.
+
+### Gestructureerde Data
+Gestructureerde data is data die is georganiseerd in rijen en kolommen, waarbij elke rij dezelfde set kolommen heeft. Kolommen vertegenwoordigen een waarde van een bepaald type en worden geïdentificeerd met een naam die beschrijft wat de waarde vertegenwoordigt, terwijl rijen de daadwerkelijke waarden bevatten. Kolommen hebben vaak een specifieke set regels of beperkingen voor de waarden om ervoor te zorgen dat de waarden de kolom nauwkeurig vertegenwoordigen. Stel je bijvoorbeeld een spreadsheet voor met klanten, waarbij elke rij een telefoonnummer moet hebben en de telefoonnummers nooit alfabetische tekens bevatten. Er kunnen regels worden toegepast op de kolom met telefoonnummers om ervoor te zorgen dat deze nooit leeg is en alleen cijfers bevat.
+
+Een voordeel van gestructureerde data is dat het zo kan worden georganiseerd dat het kan worden gerelateerd aan andere gestructureerde data. Omdat de data echter is ontworpen om op een specifieke manier te worden georganiseerd, kan het veel moeite kosten om wijzigingen aan te brengen in de algehele structuur. Stel bijvoorbeeld dat je een e-mailkolom toevoegt aan de klanten-spreadsheet die niet leeg mag zijn; dan moet je bedenken hoe je deze waarden toevoegt aan de bestaande rijen klanten in de dataset.
+
+Voorbeelden van gestructureerde data: spreadsheets, relationele databases, telefoonnummers, bankafschriften.
+
+### Ongestructureerde Data
+Ongestructureerde data kan meestal niet worden gecategoriseerd in rijen of kolommen en bevat geen formaat of set regels om te volgen. Omdat ongestructureerde data minder beperkingen heeft op de structuur, is het gemakkelijker om nieuwe informatie toe te voegen in vergelijking met een gestructureerde dataset. Als een sensor die elke 2 minuten gegevens over luchtdruk vastlegt een update ontvangt waarmee het nu ook temperatuur kan meten en registreren, hoeft de bestaande data niet te worden aangepast als deze ongestructureerd is. Dit kan echter betekenen dat het analyseren of onderzoeken van dit type data langer duurt. Stel bijvoorbeeld dat een wetenschapper de gemiddelde temperatuur van de vorige maand wil berekenen op basis van de gegevens van de sensor, maar ontdekt dat de sensor een "e" heeft geregistreerd in sommige van zijn gegevens om aan te geven dat deze kapot was in plaats van een typisch getal, wat betekent dat de data onvolledig is.
+
+Voorbeelden van ongestructureerde data: tekstbestanden, sms-berichten, videobestanden.
+
+### Semi-gestructureerde Data
+Semi-gestructureerde data heeft kenmerken die het een combinatie maken van gestructureerde en ongestructureerde data. Het voldoet meestal niet aan een formaat van rijen en kolommen, maar is georganiseerd op een manier die als gestructureerd wordt beschouwd en kan een vast formaat of een set regels volgen. De structuur varieert per bron, van een goed gedefinieerde hiërarchie tot iets flexibelers dat eenvoudige integratie van nieuwe informatie mogelijk maakt. Metadata zijn indicatoren die helpen bepalen hoe de data is georganiseerd en opgeslagen en hebben verschillende namen, afhankelijk van het type data. Enkele veelvoorkomende namen voor metadata zijn tags, elementen, entiteiten en attributen. Een typisch e-mailbericht heeft bijvoorbeeld een onderwerp, een hoofdtekst en een set ontvangers en kan worden georganiseerd op basis van wie het heeft verzonden of wanneer het is verzonden.
+
+Voorbeelden van semi-gestructureerde data: HTML, CSV-bestanden, JavaScript Object Notation (JSON).
+
+## Bronnen van Data
+
+Een databron is de oorspronkelijke locatie waar de data is gegenereerd of waar het "leeft" en varieert afhankelijk van hoe en wanneer het is verzameld. Data die door de gebruiker(s) zelf wordt gegenereerd, wordt primaire data genoemd, terwijl secundaire data afkomstig is van een bron die data heeft verzameld voor algemeen gebruik. Bijvoorbeeld, een groep wetenschappers die observaties in een regenwoud verzamelt, wordt als primair beschouwd, en als ze besluiten deze te delen met andere wetenschappers, wordt het als secundair beschouwd voor degenen die het gebruiken.
+
+Databases zijn een veelvoorkomende bron en vertrouwen op een databasebeheersysteem om de data te hosten en te onderhouden, waarbij gebruikers opdrachten genaamd queries gebruiken om de data te verkennen. Bestanden als databronnen kunnen audio-, beeld- en videobestanden zijn, evenals spreadsheets zoals Excel. Internetbronnen zijn een veelvoorkomende locatie voor het hosten van data, waar zowel databases als bestanden te vinden zijn. Application programming interfaces, ook wel API's genoemd, stellen programmeurs in staat om manieren te creëren om data via het internet te delen met externe gebruikers, terwijl het proces van webscraping data van een webpagina extraheert. De [lessen in Werken met Data](../../../../../../../../../2-Working-With-Data) richten zich op hoe je verschillende databronnen kunt gebruiken.
+
+## Conclusie
+
+In deze les hebben we geleerd:
+
+- Wat data is
+- Hoe data wordt beschreven
+- Hoe data wordt geclassificeerd en gecategoriseerd
+- Waar data te vinden is
+
+## 🚀 Uitdaging
+
+Kaggle is een uitstekende bron voor open datasets. Gebruik de [dataset zoektool](https://www.kaggle.com/datasets) om enkele interessante datasets te vinden en classificeer 3-5 datasets volgens deze criteria:
+
+- Is de data kwantitatief of kwalitatief?
+- Is de data gestructureerd, ongestructureerd of semi-gestructureerd?
+
+## [Post-Lecture Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/5)
+
+## Review & Zelfstudie
+
+- Deze Microsoft Learn-eenheid, getiteld [Classificeer je Data](https://docs.microsoft.com/en-us/learn/modules/choose-storage-approach-in-azure/2-classify-data), biedt een gedetailleerd overzicht van gestructureerde, semi-gestructureerde en ongestructureerde data.
+
+## Opdracht
+
+[Datasets Classificeren](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/1-Introduction/03-defining-data/assignment.md b/translations/nl/1-Introduction/03-defining-data/assignment.md
new file mode 100644
index 00000000..fca83fc0
--- /dev/null
+++ b/translations/nl/1-Introduction/03-defining-data/assignment.md
@@ -0,0 +1,79 @@
+
+# Classificeren van datasets
+
+## Instructies
+
+Volg de aanwijzingen in deze opdracht om de gegevens te identificeren en te classificeren met één van elk van de volgende datatypes:
+
+**Structuurtypes**: Gestructureerd, Semi-gestructureerd, of Ongestructureerd
+
+**Waarde Types**: Kwalitatief of Kwantitatief
+
+**Bron Types**: Primair of Secundair
+
+1. Een bedrijf is overgenomen en heeft nu een moederbedrijf. De datawetenschappers hebben een spreadsheet ontvangen met klanttelefoonnummers van het moederbedrijf.
+
+Structuurtype:
+
+Waarde Type:
+
+Bron Type:
+
+---
+
+2. Een smartwatch verzamelt hartslaggegevens van de drager, en de ruwe data is in JSON-formaat.
+
+Structuurtype:
+
+Waarde Type:
+
+Bron Type:
+
+---
+
+3. Een werkplekenquête over het moreel van werknemers die is opgeslagen in een CSV-bestand.
+
+Structuurtype:
+
+Waarde Type:
+
+Bron Type:
+
+---
+
+4. Astrofysici hebben toegang tot een database van sterrenstelsels die is verzameld door een ruimtesonde. De gegevens bevatten het aantal planeten binnen elk sterrenstelsel.
+
+Structuurtype:
+
+Waarde Type:
+
+Bron Type:
+
+---
+
+5. Een persoonlijke financiële app gebruikt API's om verbinding te maken met de financiële accounts van een gebruiker om hun netto waarde te berekenen. Ze kunnen al hun transacties zien in een formaat van rijen en kolommen dat lijkt op een spreadsheet.
+
+Structuurtype:
+
+Waarde Type:
+
+Bron Type:
+
+## Rubriek
+
+Uitmuntend | Voldoende | Verbetering nodig
+--- | --- | -- |
+Identificeert correct alle structuur-, waarde- en brontypes |Identificeert correct 3 structuur-, waarde- en brontypes|Identificeert correct 2 of minder structuur-, waarde- en brontypes|
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/1-Introduction/04-stats-and-probability/README.md b/translations/nl/1-Introduction/04-stats-and-probability/README.md
new file mode 100644
index 00000000..763d99a8
--- /dev/null
+++ b/translations/nl/1-Introduction/04-stats-and-probability/README.md
@@ -0,0 +1,276 @@
+
+# Een Korte Introductie tot Statistiek en Kansrekening
+
+| ](../../sketchnotes/04-Statistics-Probability.png)|
+|:---:|
+| Statistiek en Kansrekening - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+Statistiek en Kansrekening zijn twee sterk verwante gebieden binnen de Wiskunde die zeer relevant zijn voor Data Science. Het is mogelijk om met data te werken zonder diepgaande kennis van wiskunde, maar het is toch beter om ten minste enkele basisconcepten te begrijpen. Hier bieden we een korte introductie die je op weg helpt.
+
+[](https://youtu.be/Z5Zy85g4Yjw)
+
+## [Quiz voorafgaand aan de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/6)
+
+## Kansrekening en Willekeurige Variabelen
+
+**Kans** is een getal tussen 0 en 1 dat uitdrukt hoe waarschijnlijk een **gebeurtenis** is. Het wordt gedefinieerd als het aantal positieve uitkomsten (die leiden tot de gebeurtenis), gedeeld door het totale aantal uitkomsten, ervan uitgaande dat alle uitkomsten even waarschijnlijk zijn. Bijvoorbeeld, als we een dobbelsteen gooien, is de kans op een even getal 3/6 = 0,5.
+
+Wanneer we over gebeurtenissen praten, gebruiken we **willekeurige variabelen**. Bijvoorbeeld, de willekeurige variabele die het getal vertegenwoordigt dat wordt gegooid met een dobbelsteen, kan waarden aannemen van 1 tot 6. De verzameling getallen van 1 tot 6 wordt de **steekproefruimte** genoemd. We kunnen praten over de kans dat een willekeurige variabele een bepaalde waarde aanneemt, bijvoorbeeld P(X=3)=1/6.
+
+De willekeurige variabele in het vorige voorbeeld wordt **discreet** genoemd, omdat het een telbare steekproefruimte heeft, d.w.z. er zijn afzonderlijke waarden die kunnen worden opgesomd. Er zijn gevallen waarin de steekproefruimte een bereik van reële getallen is, of de gehele verzameling reële getallen. Dergelijke variabelen worden **continu** genoemd. Een goed voorbeeld is de aankomsttijd van een bus.
+
+## Kansverdeling
+
+In het geval van discrete willekeurige variabelen is het eenvoudig om de kans van elke gebeurtenis te beschrijven met een functie P(X). Voor elke waarde *s* uit de steekproefruimte *S* geeft deze een getal tussen 0 en 1, zodanig dat de som van alle waarden van P(X=s) voor alle gebeurtenissen gelijk is aan 1.
+
+De meest bekende discrete verdeling is de **uniforme verdeling**, waarbij er een steekproefruimte is van N elementen, met een gelijke kans van 1/N voor elk van hen.
+
+Het is moeilijker om de kansverdeling van een continue variabele te beschrijven, met waarden uit een interval [a,b], of de gehele verzameling reële getallen ℝ. Neem bijvoorbeeld de aankomsttijd van een bus. In feite is de kans dat een bus precies op een bepaald tijdstip *t* aankomt, 0!
+
+> Nu weet je dat gebeurtenissen met kans 0 toch gebeuren, en vaak zelfs! Bijvoorbeeld elke keer dat de bus aankomt!
+
+We kunnen alleen spreken over de kans dat een variabele binnen een bepaald interval van waarden valt, bijvoorbeeld P(t1≤X2). In dit geval wordt de kansverdeling beschreven door een **kansdichtheidsfunctie** p(x), zodanig dat
+
+![P(t_1\le X1, x2, ..., xn. We kunnen de **gemiddelde** (of **rekenkundige gemiddelde**) waarde van de reeks op de traditionele manier definiëren als (x1+x2+xn)/n. Naarmate we de steekproefgrootte vergroten (d.w.z. de limiet nemen met n→∞), verkrijgen we het gemiddelde (ook wel **verwachtingswaarde** genoemd) van de verdeling. We noteren de verwachtingswaarde met **E**(x).
+
+> Het kan worden aangetoond dat voor elke discrete verdeling met waarden {x1, x2, ..., xN} en bijbehorende kansen p1, p2, ..., pN, de verwachtingswaarde gelijk is aan E(X)=x1p1+x2p2+...+xNpN.
+
+Om te bepalen hoe ver de waarden verspreid zijn, kunnen we de variantie berekenen: σ2 = ∑(xi - μ)2/n, waarbij μ het gemiddelde van de reeks is. De waarde σ wordt de **standaarddeviatie** genoemd, en σ2 wordt de **variantie** genoemd.
+
+## Modus, Mediaan en Kwartielen
+
+Soms geeft het gemiddelde geen goed beeld van de "typische" waarde van data. Bijvoorbeeld, wanneer er enkele extreme waarden zijn die volledig buiten het bereik liggen, kunnen deze het gemiddelde beïnvloeden. Een andere goede indicator is de **mediaan**, een waarde zodanig dat de helft van de datapunten lager is en de andere helft hoger.
+
+Om de verdeling van data beter te begrijpen, is het nuttig om te praten over **kwartielen**:
+
+* Het eerste kwartiel, of Q1, is een waarde waarbij 25% van de data eronder valt.
+* Het derde kwartiel, of Q3, is een waarde waarbij 75% van de data eronder valt.
+
+Grafisch kunnen we de relatie tussen mediaan en kwartielen weergeven in een diagram dat een **boxplot** wordt genoemd:
+
+
+
+Hier berekenen we ook de **interkwartielafstand** IQR=Q3-Q1, en zogenaamde **uitbijters** - waarden die buiten de grenzen [Q1-1.5*IQR,Q3+1.5*IQR] liggen.
+
+Voor een eindige verdeling met een klein aantal mogelijke waarden is een goede "typische" waarde degene die het vaakst voorkomt, de **modus**. Dit wordt vaak toegepast op categorische data, zoals kleuren. Stel je een situatie voor waarin we twee groepen mensen hebben - sommigen die sterk de voorkeur geven aan rood, en anderen die blauw prefereren. Als we kleuren coderen met nummers, zou de gemiddelde waarde voor een favoriete kleur ergens in het oranje-groene spectrum liggen, wat geen echte voorkeur van een van beide groepen aangeeft. De modus zou echter een van de kleuren zijn, of beide kleuren, als het aantal mensen dat ervoor stemt gelijk is (in dat geval noemen we de steekproef **multimodaal**).
+
+## Data uit de Werkelijkheid
+
+Wanneer we data uit het echte leven analyseren, zijn deze vaak geen willekeurige variabelen in de strikte zin, omdat we geen experimenten uitvoeren met onbekende uitkomsten. Neem bijvoorbeeld een team van honkbalspelers en hun lichaamsgegevens, zoals lengte, gewicht en leeftijd. Deze cijfers zijn niet echt willekeurig, maar we kunnen nog steeds dezelfde wiskundige concepten toepassen. Bijvoorbeeld, een reeks gewichten van mensen kan worden beschouwd als een reeks waarden getrokken uit een willekeurige variabele. Hieronder staat de reeks gewichten van echte honkbalspelers uit de [Major League Baseball](http://mlb.mlb.com/index.jsp), afkomstig uit [deze dataset](http://wiki.stat.ucla.edu/socr/index.php/SOCR_Data_MLB_HeightsWeights) (voor jouw gemak zijn alleen de eerste 20 waarden weergegeven):
+
+```
+[180.0, 215.0, 210.0, 210.0, 188.0, 176.0, 209.0, 200.0, 231.0, 180.0, 188.0, 180.0, 185.0, 160.0, 180.0, 185.0, 197.0, 189.0, 185.0, 219.0]
+```
+
+> **Opmerking**: Om een voorbeeld te zien van het werken met deze dataset, bekijk de [bijbehorende notebook](notebook.ipynb). Er zijn ook een aantal uitdagingen in deze les, en je kunt deze voltooien door wat code toe te voegen aan die notebook. Als je niet zeker weet hoe je met data moet werken, maak je geen zorgen - we komen later terug op het werken met data in Python. Als je niet weet hoe je code uitvoert in Jupyter Notebook, bekijk dan [dit artikel](https://soshnikov.com/education/how-to-execute-notebooks-from-github/).
+
+Hier is de boxplot die het gemiddelde, de mediaan en de kwartielen voor onze data toont:
+
+
+
+Omdat onze data informatie bevat over verschillende speler **rollen**, kunnen we ook een boxplot per rol maken - dit geeft ons een idee van hoe de parameters verschillen per rol. Deze keer bekijken we de lengte:
+
+
+
+Dit diagram suggereert dat de lengte van eerste honkspelers gemiddeld hoger is dan die van tweede honkspelers. Later in deze les leren we hoe we deze hypothese formeler kunnen testen en hoe we kunnen aantonen dat onze data statistisch significant is om dit te bewijzen.
+
+> Bij het werken met data uit de werkelijkheid gaan we ervan uit dat alle datapunten steekproeven zijn getrokken uit een bepaalde kansverdeling. Deze aanname stelt ons in staat om machine learning-technieken toe te passen en werkende voorspellende modellen te bouwen.
+
+Om te zien wat de verdeling van onze data is, kunnen we een grafiek maken die een **histogram** wordt genoemd. De X-as bevat een aantal verschillende gewichtintervallen (de zogenaamde **bins**), en de verticale as toont het aantal keren dat onze steekproef van de willekeurige variabele binnen een bepaald interval viel.
+
+
+
+Uit dit histogram kun je zien dat alle waarden gecentreerd zijn rond een bepaald gemiddeld gewicht, en hoe verder we van dat gewicht af gaan, hoe minder vaak gewichten van die waarde voorkomen. Met andere woorden, het is zeer onwaarschijnlijk dat het gewicht van een honkbalspeler sterk afwijkt van het gemiddelde gewicht. De variantie van gewichten laat zien in hoeverre gewichten waarschijnlijk verschillen van het gemiddelde.
+
+> Als we gewichten van andere mensen nemen, niet uit de honkbalcompetitie, is de verdeling waarschijnlijk anders. De vorm van de verdeling blijft echter hetzelfde, maar het gemiddelde en de variantie zouden veranderen. Dus, als we ons model trainen op honkbalspelers, is het waarschijnlijk dat het verkeerde resultaten geeft wanneer het wordt toegepast op studenten van een universiteit, omdat de onderliggende verdeling anders is.
+
+## Normale Verdeling
+
+De verdeling van gewichten die we hierboven hebben gezien, is zeer typisch, en veel metingen uit de werkelijkheid volgen hetzelfde type verdeling, maar met een ander gemiddelde en een andere variantie. Deze verdeling wordt de **normale verdeling** genoemd en speelt een zeer belangrijke rol in de statistiek.
+
+Het gebruik van een normale verdeling is een correcte manier om willekeurige gewichten van potentiële honkbalspelers te genereren. Zodra we het gemiddelde gewicht `mean` en de standaarddeviatie `std` kennen, kunnen we 1000 gewichtsmonsters genereren op de volgende manier:
+```python
+samples = np.random.normal(mean,std,1000)
+```
+
+Als we het histogram van de gegenereerde monsters plotten, zien we een afbeelding die erg lijkt op de bovenstaande. En als we het aantal monsters en het aantal bins vergroten, kunnen we een afbeelding van een normale verdeling genereren die dichter bij ideaal is:
+
+
+
+*Normale Verdeling met mean=0 en std.dev=1*
+
+## Betrouwbaarheidsintervallen
+
+Wanneer we het hebben over gewichten van honkbalspelers, gaan we ervan uit dat er een bepaalde **willekeurige variabele W** is die overeenkomt met de ideale kansverdeling van gewichten van alle honkbalspelers (de zogenaamde **populatie**). Onze reeks gewichten komt overeen met een subset van alle honkbalspelers die we een **steekproef** noemen. Een interessante vraag is: kunnen we de parameters van de verdeling van W kennen, d.w.z. het gemiddelde en de variantie van de populatie?
+
+Het eenvoudigste antwoord zou zijn om het gemiddelde en de variantie van onze steekproef te berekenen. Het kan echter gebeuren dat onze willekeurige steekproef de volledige populatie niet nauwkeurig vertegenwoordigt. Daarom is het logisch om te spreken over **betrouwbaarheidsintervallen**.
+> **Betrouwbaarheidsinterval** is de schatting van het werkelijke gemiddelde van de populatie op basis van onze steekproef, die met een bepaalde waarschijnlijkheid (of **betrouwbaarheidsniveau**) nauwkeurig is.
+Stel dat we een steekproef X1, ..., Xn hebben uit onze verdeling. Elke keer dat we een steekproef trekken uit onze verdeling, krijgen we een andere gemiddelde waarde μ. Daarom kan μ worden beschouwd als een willekeurige variabele. Een **betrouwbaarheidsinterval** met betrouwbaarheid p is een paar waarden (Lp,Rp), zodanig dat **P**(Lp≤μ≤Rp) = p, oftewel de kans dat de gemeten gemiddelde waarde binnen het interval valt, is gelijk aan p.
+
+Het gaat verder dan onze korte introductie om in detail te bespreken hoe deze betrouwbaarheidsintervallen worden berekend. Meer details zijn te vinden op [Wikipedia](https://en.wikipedia.org/wiki/Confidence_interval). Kort gezegd definiëren we de verdeling van het berekende steekproefgemiddelde ten opzichte van het werkelijke gemiddelde van de populatie, wat de **studentverdeling** wordt genoemd.
+
+> **Interessant feit**: De studentverdeling is vernoemd naar wiskundige William Sealy Gosset, die zijn artikel publiceerde onder het pseudoniem "Student". Hij werkte in de Guinness-brouwerij, en volgens een van de verhalen wilde zijn werkgever niet dat het grote publiek wist dat ze statistische tests gebruikten om de kwaliteit van grondstoffen te bepalen.
+
+Als we het gemiddelde μ van onze populatie willen schatten met betrouwbaarheid p, moeten we het *(1-p)/2-de percentiel* van een studentverdeling A nemen, die ofwel uit tabellen kan worden gehaald, of kan worden berekend met ingebouwde functies van statistische software (bijv. Python, R, enz.). Dan wordt het interval voor μ gegeven door X±A*D/√n, waarbij X het verkregen gemiddelde van de steekproef is en D de standaardafwijking.
+
+> **Opmerking**: We laten ook de bespreking van een belangrijk concept, namelijk [vrijheidsgraden](https://en.wikipedia.org/wiki/Degrees_of_freedom_(statistics)), achterwege, wat belangrijk is in relatie tot de studentverdeling. Je kunt meer uitgebreide boeken over statistiek raadplegen om dit concept dieper te begrijpen.
+
+Een voorbeeld van het berekenen van een betrouwbaarheidsinterval voor gewichten en lengtes is te vinden in de [bijbehorende notebooks](notebook.ipynb).
+
+| p | Gemiddelde gewicht |
+|------|--------------------|
+| 0.85 | 201.73±0.94 |
+| 0.90 | 201.73±1.08 |
+| 0.95 | 201.73±1.28 |
+
+Merk op dat hoe hoger de betrouwbaarheidskans is, hoe breder het betrouwbaarheidsinterval wordt.
+
+## Hypothesetoetsing
+
+In onze dataset van honkbalspelers zijn er verschillende spelersrollen, die als volgt kunnen worden samengevat (bekijk de [bijbehorende notebook](notebook.ipynb) om te zien hoe deze tabel kan worden berekend):
+
+| Rol | Lengte | Gewicht | Aantal |
+|-------------------|------------|------------|--------|
+| Catcher | 72.723684 | 204.328947 | 76 |
+| Designated_Hitter | 74.222222 | 220.888889 | 18 |
+| First_Baseman | 74.000000 | 213.109091 | 55 |
+| Outfielder | 73.010309 | 199.113402 | 194 |
+| Relief_Pitcher | 74.374603 | 203.517460 | 315 |
+| Second_Baseman | 71.362069 | 184.344828 | 58 |
+| Shortstop | 71.903846 | 182.923077 | 52 |
+| Starting_Pitcher | 74.719457 | 205.163636 | 221 |
+| Third_Baseman | 73.044444 | 200.955556 | 45 |
+
+We kunnen zien dat de gemiddelde lengte van eerste honkspelers hoger is dan die van tweede honkspelers. Daarom kunnen we geneigd zijn te concluderen dat **eerste honkspelers langer zijn dan tweede honkspelers**.
+
+> Deze uitspraak wordt een **hypothese** genoemd, omdat we niet weten of het feit daadwerkelijk waar is.
+
+Het is echter niet altijd duidelijk of we deze conclusie kunnen trekken. Uit de bovenstaande discussie weten we dat elk gemiddelde een bijbehorend betrouwbaarheidsinterval heeft, en dat dit verschil dus gewoon een statistische fout kan zijn. We hebben een meer formele manier nodig om onze hypothese te testen.
+
+Laten we betrouwbaarheidsintervallen afzonderlijk berekenen voor de lengtes van eerste en tweede honkspelers:
+
+| Betrouwbaarheid | Eerste honkspelers | Tweede honkspelers |
+|-----------------|---------------------|--------------------|
+| 0.85 | 73.62..74.38 | 71.04..71.69 |
+| 0.90 | 73.56..74.44 | 70.99..71.73 |
+| 0.95 | 73.47..74.53 | 70.92..71.81 |
+
+We kunnen zien dat de intervallen onder geen enkele betrouwbaarheid overlappen. Dat bewijst onze hypothese dat eerste honkspelers langer zijn dan tweede honkspelers.
+
+Formeler gezegd is het probleem dat we proberen op te lossen om te zien of **twee kansverdelingen hetzelfde zijn**, of op zijn minst dezelfde parameters hebben. Afhankelijk van de verdeling moeten we daarvoor verschillende tests gebruiken. Als we weten dat onze verdelingen normaal zijn, kunnen we de **[Student t-test](https://en.wikipedia.org/wiki/Student%27s_t-test)** toepassen.
+
+Bij de Student t-test berekenen we de zogenaamde **t-waarde**, die het verschil tussen gemiddelden aangeeft, rekening houdend met de variantie. Het is aangetoond dat de t-waarde de **studentverdeling** volgt, wat ons in staat stelt de drempelwaarde te verkrijgen voor een gegeven betrouwbaarheidsniveau **p** (dit kan worden berekend of opgezocht in numerieke tabellen). We vergelijken vervolgens de t-waarde met deze drempel om de hypothese goed te keuren of te verwerpen.
+
+In Python kunnen we het **SciPy**-pakket gebruiken, dat de functie `ttest_ind` bevat (naast vele andere nuttige statistische functies!). Deze functie berekent de t-waarde voor ons en doet ook de omgekeerde lookup van de betrouwbaarheids-p-waarde, zodat we alleen naar de betrouwbaarheid hoeven te kijken om een conclusie te trekken.
+
+Bijvoorbeeld, onze vergelijking tussen de lengtes van eerste en tweede honkspelers geeft ons de volgende resultaten:
+```python
+from scipy.stats import ttest_ind
+
+tval, pval = ttest_ind(df.loc[df['Role']=='First_Baseman',['Height']], df.loc[df['Role']=='Designated_Hitter',['Height']],equal_var=False)
+print(f"T-value = {tval[0]:.2f}\nP-value: {pval[0]}")
+```
+```
+T-value = 7.65
+P-value: 9.137321189738925e-12
+```
+In ons geval is de p-waarde zeer laag, wat betekent dat er sterk bewijs is dat eerste honkspelers langer zijn.
+
+Er zijn ook andere soorten hypothesen die we mogelijk willen testen, bijvoorbeeld:
+* Bewijzen dat een bepaalde steekproef een bepaalde verdeling volgt. In ons geval hebben we aangenomen dat lengtes normaal verdeeld zijn, maar dat vereist formele statistische verificatie.
+* Bewijzen dat een gemiddelde waarde van een steekproef overeenkomt met een vooraf gedefinieerde waarde.
+* Vergelijken van gemiddelden van meerdere steekproeven (bijv. wat is het verschil in geluksniveaus tussen verschillende leeftijdsgroepen).
+
+## Wet van de grote aantallen en centrale limietstelling
+
+Een van de redenen waarom de normale verdeling zo belangrijk is, is de zogenaamde **centrale limietstelling**. Stel dat we een grote steekproef hebben van onafhankelijke N waarden X1, ..., XN, getrokken uit een willekeurige verdeling met gemiddelde μ en variantie σ2. Dan, voor voldoende grote N (met andere woorden, wanneer N→∞), zal het gemiddelde ΣiXi normaal verdeeld zijn, met gemiddelde μ en variantie σ2/N.
+
+> Een andere manier om de centrale limietstelling te interpreteren is te zeggen dat, ongeacht de verdeling, wanneer je het gemiddelde berekent van een som van willekeurige variabelen, je uitkomt op een normale verdeling.
+
+Uit de centrale limietstelling volgt ook dat, wanneer N→∞, de kans dat het steekproefgemiddelde gelijk is aan μ, 1 wordt. Dit staat bekend als **de wet van de grote aantallen**.
+
+## Covariantie en correlatie
+
+Een van de dingen die Data Science doet, is het vinden van relaties tussen gegevens. We zeggen dat twee reeksen **correleren** wanneer ze hetzelfde gedrag vertonen op hetzelfde moment, d.w.z. ze stijgen/dalen tegelijkertijd, of de ene reeks stijgt wanneer de andere daalt en vice versa. Met andere woorden, er lijkt een relatie te zijn tussen twee reeksen.
+
+> Correlatie geeft niet noodzakelijk een oorzakelijk verband aan tussen twee reeksen; soms kunnen beide variabelen afhankelijk zijn van een externe oorzaak, of het kan puur toeval zijn dat de twee reeksen correleren. Sterke wiskundige correlatie is echter een goede indicatie dat twee variabelen op de een of andere manier verbonden zijn.
+
+Wiskundig gezien is het belangrijkste concept dat de relatie tussen twee willekeurige variabelen laat zien **covariantie**, die als volgt wordt berekend: Cov(X,Y) = **E**\[(X-**E**(X))(Y-**E**(Y))\]. We berekenen de afwijking van beide variabelen ten opzichte van hun gemiddelde waarden, en vervolgens het product van die afwijkingen. Als beide variabelen samen afwijken, zal het product altijd een positieve waarde zijn, wat optelt tot een positieve covariantie. Als beide variabelen niet synchroon afwijken (d.w.z. de ene daalt onder het gemiddelde wanneer de andere boven het gemiddelde stijgt), krijgen we altijd negatieve getallen, die optellen tot een negatieve covariantie. Als de afwijkingen niet afhankelijk zijn, zullen ze optellen tot ongeveer nul.
+
+De absolute waarde van covariantie zegt niet veel over hoe groot de correlatie is, omdat het afhangt van de grootte van de werkelijke waarden. Om het te normaliseren, kunnen we de covariantie delen door de standaardafwijking van beide variabelen, om **correlatie** te krijgen. Het goede is dat correlatie altijd in het bereik van [-1,1] ligt, waarbij 1 een sterke positieve correlatie tussen waarden aangeeft, -1 een sterke negatieve correlatie, en 0 helemaal geen correlatie (variabelen zijn onafhankelijk).
+
+**Voorbeeld**: We kunnen de correlatie berekenen tussen gewichten en lengtes van honkbalspelers uit de eerder genoemde dataset:
+```python
+print(np.corrcoef(weights,heights))
+```
+Als resultaat krijgen we een **correlatiematrix** zoals deze:
+```
+array([[1. , 0.52959196],
+ [0.52959196, 1. ]])
+```
+
+> Een correlatiematrix C kan worden berekend voor elk aantal invoerreeksen S1, ..., Sn. De waarde van Cij is de correlatie tussen Si en Sj, en diagonale elementen zijn altijd 1 (wat ook zelfcorrelatie van Si is).
+
+In ons geval geeft de waarde 0.53 aan dat er enige correlatie is tussen het gewicht en de lengte van een persoon. We kunnen ook een spreidingsdiagram maken van de ene waarde tegen de andere om de relatie visueel te zien:
+
+
+
+> Meer voorbeelden van correlatie en covariantie zijn te vinden in de [bijbehorende notebook](notebook.ipynb).
+
+## Conclusie
+
+In deze sectie hebben we geleerd:
+
+* basisstatistische eigenschappen van gegevens, zoals gemiddelde, variantie, modus en kwartielen
+* verschillende verdelingen van willekeurige variabelen, inclusief normale verdeling
+* hoe correlatie tussen verschillende eigenschappen te vinden
+* hoe het wiskundige en statistische apparaat te gebruiken om hypothesen te bewijzen
+* hoe betrouwbaarheidsintervallen te berekenen voor een willekeurige variabele op basis van een steekproef
+
+Hoewel dit zeker geen uitputtende lijst is van onderwerpen binnen waarschijnlijkheid en statistiek, zou het voldoende moeten zijn om je een goede start te geven in deze cursus.
+
+## 🚀 Uitdaging
+
+Gebruik de voorbeeldcode in de notebook om andere hypothesen te testen:
+1. Eerste honkspelers zijn ouder dan tweede honkspelers
+2. Eerste honkspelers zijn langer dan derde honkspelers
+3. Shortstops zijn langer dan tweede honkspelers
+
+## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/7)
+
+## Review & Zelfstudie
+
+Waarschijnlijkheid en statistiek is zo'n breed onderwerp dat het een eigen cursus verdient. Als je dieper in de theorie wilt duiken, kun je enkele van de volgende boeken lezen:
+
+1. [Carlos Fernandez-Granda](https://cims.nyu.edu/~cfgranda/) van New York University heeft geweldige collegedictaten [Probability and Statistics for Data Science](https://cims.nyu.edu/~cfgranda/pages/stuff/probability_stats_for_DS.pdf) (online beschikbaar)
+1. [Peter en Andrew Bruce. Practical Statistics for Data Scientists.](https://www.oreilly.com/library/view/practical-statistics-for/9781491952955/) [[voorbeeldcode in R](https://github.com/andrewgbruce/statistics-for-data-scientists)].
+1. [James D. Miller. Statistics for Data Science](https://www.packtpub.com/product/statistics-for-data-science/9781788290678) [[voorbeeldcode in R](https://github.com/PacktPublishing/Statistics-for-Data-Science)]
+
+## Opdracht
+
+[Kleine Diabetesstudie](assignment.md)
+
+## Credits
+
+Deze les is met ♥️ geschreven door [Dmitry Soshnikov](http://soshnikov.com)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/1-Introduction/04-stats-and-probability/assignment.md b/translations/nl/1-Introduction/04-stats-and-probability/assignment.md
new file mode 100644
index 00000000..3c2cda67
--- /dev/null
+++ b/translations/nl/1-Introduction/04-stats-and-probability/assignment.md
@@ -0,0 +1,40 @@
+
+# Kleine Diabetesstudie
+
+In deze opdracht werken we met een kleine dataset van diabetespatiënten, afkomstig van [hier](https://www4.stat.ncsu.edu/~boos/var.select/diabetes.html).
+
+| | LEEFTIJD | GESLACHT | BMI | BP | S1 | S2 | S3 | S4 | S5 | S6 | Y |
+|---|----------|----------|-----|----|----|----|----|----|----|----|----|
+| 0 | 59 | 2 | 32.1| 101.| 157 | 93.2| 38.0| 4. | 4.8598 | 87 | 151 |
+| 1 | 48 | 1 | 21.6| 87.0| 183 | 103.2| 70. | 3. | 3.8918 | 69 | 75 |
+| 2 | 72 | 2 | 30.5| 93.0| 156 | 93.6| 41.0| 4.0| 4. | 85 | 141 |
+| ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
+
+## Instructies
+
+* Open het [opdracht-notebook](assignment.ipynb) in een jupyter-notebookomgeving
+* Voltooi alle taken die in het notebook worden vermeld, namelijk:
+ * [ ] Bereken gemiddelde waarden en variantie voor alle waarden
+ * [ ] Maak boxplots voor BMI, BP en Y afhankelijk van geslacht
+ * [ ] Wat is de verdeling van de variabelen Leeftijd, Geslacht, BMI en Y?
+ * [ ] Test de correlatie tussen verschillende variabelen en de progressie van de ziekte (Y)
+ * [ ] Test de hypothese dat de mate van diabetesprogressie verschilt tussen mannen en vrouwen
+
+## Beoordelingscriteria
+
+Uitmuntend | Voldoende | Verbetering Nodig
+--- | --- | -- |
+Alle vereiste taken zijn voltooid, grafisch geïllustreerd en uitgelegd | De meeste taken zijn voltooid, maar uitleg of conclusies van grafieken en/of verkregen waarden ontbreken | Alleen basistaken zoals het berekenen van gemiddelde/variantie en eenvoudige grafieken zijn voltooid, er worden geen conclusies getrokken uit de data
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/1-Introduction/README.md b/translations/nl/1-Introduction/README.md
new file mode 100644
index 00000000..cd2b57c0
--- /dev/null
+++ b/translations/nl/1-Introduction/README.md
@@ -0,0 +1,31 @@
+
+# Introductie tot Data Science
+
+
+> Foto door Stephen Dawson op Unsplash
+
+In deze lessen ontdek je hoe Data Science wordt gedefinieerd en leer je over ethische overwegingen waar een datawetenschapper rekening mee moet houden. Je leert ook hoe data wordt gedefinieerd en krijgt een introductie tot statistiek en kansberekening, de kerngebieden van Data Science.
+
+### Onderwerpen
+
+1. [Data Science definiëren](01-defining-data-science/README.md)
+2. [Ethische aspecten van Data Science](02-ethics/README.md)
+3. [Data definiëren](03-defining-data/README.md)
+4. [Introductie tot Statistiek en Kansberekening](04-stats-and-probability/README.md)
+
+### Credits
+
+Deze lessen zijn met ❤️ geschreven door [Nitya Narasimhan](https://twitter.com/nitya) en [Dmitry Soshnikov](https://twitter.com/shwars).
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/2-Working-With-Data/05-relational-databases/README.md b/translations/nl/2-Working-With-Data/05-relational-databases/README.md
new file mode 100644
index 00000000..b0862640
--- /dev/null
+++ b/translations/nl/2-Working-With-Data/05-relational-databases/README.md
@@ -0,0 +1,195 @@
+
+# Werken met Data: Relationele Databases
+
+| ](../../sketchnotes/05-RelationalData.png)|
+|:---:|
+| Werken met Data: Relationele Databases - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+De kans is groot dat je in het verleden een spreadsheet hebt gebruikt om informatie op te slaan. Je had een set van rijen en kolommen, waarbij de rijen de informatie (of data) bevatten en de kolommen de informatie beschreven (soms metadata genoemd). Een relationele database is gebaseerd op dit kernprincipe van kolommen en rijen in tabellen, waardoor je informatie over meerdere tabellen kunt verspreiden. Dit stelt je in staat om met complexere data te werken, duplicatie te vermijden en flexibiliteit te hebben in de manier waarop je de data onderzoekt. Laten we de concepten van een relationele database verkennen.
+
+## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/8)
+
+## Het begint allemaal met tabellen
+
+Een relationele database heeft tabellen als kern. Net zoals bij een spreadsheet is een tabel een verzameling van kolommen en rijen. De rij bevat de data of informatie waarmee we willen werken, zoals de naam van een stad of de hoeveelheid neerslag. De kolommen beschrijven de data die ze opslaan.
+
+Laten we onze verkenning beginnen door een tabel te maken om informatie over steden op te slaan. We kunnen beginnen met hun naam en land. Je zou dit in een tabel kunnen opslaan zoals hieronder:
+
+| Stad | Land |
+| --------- | ------------- |
+| Tokio | Japan |
+| Atlanta | Verenigde Staten |
+| Auckland | Nieuw-Zeeland |
+
+Let op dat de kolomnamen **stad**, **land** en **bevolking** de opgeslagen data beschrijven, en elke rij informatie bevat over één stad.
+
+## De tekortkomingen van een enkele tabelbenadering
+
+De kans is groot dat de bovenstaande tabel je relatief bekend voorkomt. Laten we wat extra data toevoegen aan onze groeiende database - jaarlijkse neerslag (in millimeters). We richten ons op de jaren 2018, 2019 en 2020. Als we dit voor Tokio zouden toevoegen, zou het er ongeveer zo uitzien:
+
+| Stad | Land | Jaar | Hoeveelheid |
+| ------ | ------- | ---- | ----------- |
+| Tokio | Japan | 2020 | 1690 |
+| Tokio | Japan | 2019 | 1874 |
+| Tokio | Japan | 2018 | 1445 |
+
+Wat valt je op aan onze tabel? Je merkt misschien dat we de naam en het land van de stad steeds opnieuw dupliceren. Dat kan behoorlijk wat opslagruimte innemen en is grotendeels onnodig om meerdere kopieën te hebben. Tokio heeft immers maar één naam die ons interesseert.
+
+OK, laten we iets anders proberen. Laten we nieuwe kolommen toevoegen voor elk jaar:
+
+| Stad | Land | 2018 | 2019 | 2020 |
+| --------- | ------------- | ---- | ---- | ---- |
+| Tokio | Japan | 1445 | 1874 | 1690 |
+| Atlanta | Verenigde Staten | 1779 | 1111 | 1683 |
+| Auckland | Nieuw-Zeeland | 1386 | 942 | 1176 |
+
+Hoewel dit de duplicatie van rijen vermijdt, brengt het een paar andere uitdagingen met zich mee. We zouden de structuur van onze tabel moeten aanpassen telkens wanneer er een nieuw jaar is. Bovendien, naarmate onze data groeit, zal het hebben van jaren als kolommen het moeilijker maken om waarden op te halen en berekeningen uit te voeren.
+
+Dit is waarom we meerdere tabellen en relaties nodig hebben. Door onze data op te splitsen kunnen we duplicatie vermijden en meer flexibiliteit hebben in hoe we met onze data werken.
+
+## De concepten van relaties
+
+Laten we terugkeren naar onze data en bepalen hoe we deze willen opsplitsen. We weten dat we de naam en het land van onze steden willen opslaan, dus dit werkt waarschijnlijk het beste in één tabel.
+
+| Stad | Land |
+| --------- | ------------- |
+| Tokio | Japan |
+| Atlanta | Verenigde Staten |
+| Auckland | Nieuw-Zeeland |
+
+Maar voordat we de volgende tabel maken, moeten we bedenken hoe we elke stad willen refereren. We hebben een soort identificator, ID of (in technische database termen) een primaire sleutel nodig. Een primaire sleutel is een waarde die wordt gebruikt om één specifieke rij in een tabel te identificeren. Hoewel dit gebaseerd kan zijn op een waarde zelf (we zouden bijvoorbeeld de naam van de stad kunnen gebruiken), moet het bijna altijd een nummer of andere identificator zijn. We willen niet dat de id ooit verandert, omdat dit de relatie zou verbreken. In de meeste gevallen zal de primaire sleutel of id een automatisch gegenereerd nummer zijn.
+
+> ✅ Primaire sleutel wordt vaak afgekort als PK
+
+### steden
+
+| stad_id | Stad | Land |
+| ------- | --------- | ------------- |
+| 1 | Tokio | Japan |
+| 2 | Atlanta | Verenigde Staten |
+| 3 | Auckland | Nieuw-Zeeland |
+
+> ✅ Je zult merken dat we de termen "id" en "primaire sleutel" door elkaar gebruiken tijdens deze les. De concepten hier zijn van toepassing op DataFrames, die je later zult verkennen. DataFrames gebruiken niet de terminologie van "primaire sleutel", maar je zult merken dat ze zich grotendeels hetzelfde gedragen.
+
+Met onze steden-tabel gemaakt, laten we de neerslag opslaan. In plaats van de volledige informatie over de stad te dupliceren, kunnen we de id gebruiken. We moeten er ook voor zorgen dat de nieuw gemaakte tabel een *id*-kolom heeft, aangezien alle tabellen een id of primaire sleutel moeten hebben.
+
+### neerslag
+
+| neerslag_id | stad_id | Jaar | Hoeveelheid |
+| ----------- | ------- | ---- | ----------- |
+| 1 | 1 | 2018 | 1445 |
+| 2 | 1 | 2019 | 1874 |
+| 3 | 1 | 2020 | 1690 |
+| 4 | 2 | 2018 | 1779 |
+| 5 | 2 | 2019 | 1111 |
+| 6 | 2 | 2020 | 1683 |
+| 7 | 3 | 2018 | 1386 |
+| 8 | 3 | 2019 | 942 |
+| 9 | 3 | 2020 | 1176 |
+
+Let op de **stad_id**-kolom in de nieuw gemaakte **neerslag**-tabel. Deze kolom bevat waarden die verwijzen naar de IDs in de **steden**-tabel. In technische relationele datatermen wordt dit een **vreemde sleutel** genoemd; het is een primaire sleutel uit een andere tabel. Je kunt het gewoon zien als een referentie of een pointer. **stad_id** 1 verwijst naar Tokio.
+
+> [!NOTE] Vreemde sleutel wordt vaak afgekort als FK
+
+## Data ophalen
+
+Met onze data verdeeld over twee tabellen, vraag je je misschien af hoe we deze ophalen. Als we een relationele database zoals MySQL, SQL Server of Oracle gebruiken, kunnen we een taal genaamd Structured Query Language of SQL gebruiken. SQL (soms uitgesproken als sequel) is een standaardtaal die wordt gebruikt om data in een relationele database op te halen en te wijzigen.
+
+Om data op te halen gebruik je het commando `SELECT`. In de kern **selecteer** je de kolommen die je wilt zien **uit** de tabel waarin ze staan. Als je alleen de namen van de steden wilt weergeven, kun je het volgende gebruiken:
+
+```sql
+SELECT city
+FROM cities;
+
+-- Output:
+-- Tokyo
+-- Atlanta
+-- Auckland
+```
+
+`SELECT` is waar je de kolommen opsomt, en `FROM` is waar je de tabellen opsomt.
+
+> [NOTE] SQL-syntaxis is niet hoofdlettergevoelig, wat betekent dat `select` en `SELECT` hetzelfde betekenen. Afhankelijk van het type database dat je gebruikt, kunnen de kolommen en tabellen echter wel hoofdlettergevoelig zijn. Daarom is het een goede gewoonte om alles in programmeren te behandelen alsof het hoofdlettergevoelig is. Bij het schrijven van SQL-query's is het gebruikelijk om de sleutelwoorden in hoofdletters te zetten.
+
+De bovenstaande query zal alle steden weergeven. Stel dat we alleen steden in Nieuw-Zeeland willen weergeven. We hebben een soort filter nodig. Het SQL-sleutelwoord hiervoor is `WHERE`, of "waar iets waar is".
+
+```sql
+SELECT city
+FROM cities
+WHERE country = 'New Zealand';
+
+-- Output:
+-- Auckland
+```
+
+## Data samenvoegen
+
+Tot nu toe hebben we data opgehaald uit één tabel. Nu willen we de data uit zowel **steden** als **neerslag** samenvoegen. Dit wordt gedaan door ze *te koppelen*. Je creëert in feite een verbinding tussen de twee tabellen en koppelt de waarden van een kolom uit elke tabel.
+
+In ons voorbeeld zullen we de **stad_id**-kolom in **neerslag** koppelen aan de **stad_id**-kolom in **steden**. Dit zal de neerslagwaarde koppelen aan de bijbehorende stad. Het type koppeling dat we zullen uitvoeren is een *inner* join, wat betekent dat als er rijen zijn die niet overeenkomen met iets uit de andere tabel, ze niet worden weergegeven. In ons geval heeft elke stad neerslag, dus alles zal worden weergegeven.
+
+Laten we de neerslag voor 2019 ophalen voor al onze steden.
+
+We gaan dit in stappen doen. De eerste stap is om de data samen te voegen door de kolommen voor de verbinding aan te geven - **stad_id** zoals eerder benadrukt.
+
+```sql
+SELECT cities.city
+ rainfall.amount
+FROM cities
+ INNER JOIN rainfall ON cities.city_id = rainfall.city_id
+```
+
+We hebben de twee kolommen die we willen koppelen gemarkeerd, en het feit dat we de tabellen willen samenvoegen via de **stad_id**. Nu kunnen we de `WHERE`-verklaring toevoegen om alleen jaar 2019 te filteren.
+
+```sql
+SELECT cities.city
+ rainfall.amount
+FROM cities
+ INNER JOIN rainfall ON cities.city_id = rainfall.city_id
+WHERE rainfall.year = 2019
+
+-- Output
+
+-- city | amount
+-- -------- | ------
+-- Tokyo | 1874
+-- Atlanta | 1111
+-- Auckland | 942
+```
+
+## Samenvatting
+
+Relationele databases draaien om het verdelen van informatie over meerdere tabellen, die vervolgens worden samengevoegd voor weergave en analyse. Dit biedt een hoge mate van flexibiliteit om berekeningen uit te voeren en anderszins data te manipuleren. Je hebt de kernconcepten van een relationele database gezien en hoe je een koppeling tussen twee tabellen uitvoert.
+
+## 🚀 Uitdaging
+
+Er zijn tal van relationele databases beschikbaar op het internet. Je kunt de data verkennen door gebruik te maken van de vaardigheden die je hierboven hebt geleerd.
+
+## Post-Lecture Quiz
+
+## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/9)
+
+## Review & Zelfstudie
+
+Er zijn verschillende bronnen beschikbaar op [Microsoft Learn](https://docs.microsoft.com/learn?WT.mc_id=academic-77958-bethanycheum) om je verkenning van SQL en relationele databaseconcepten voort te zetten.
+
+- [Concepten van relationele data beschrijven](https://docs.microsoft.com//learn/modules/describe-concepts-of-relational-data?WT.mc_id=academic-77958-bethanycheum)
+- [Beginnen met Queryen met Transact-SQL](https://docs.microsoft.com//learn/paths/get-started-querying-with-transact-sql?WT.mc_id=academic-77958-bethanycheum) (Transact-SQL is een versie van SQL)
+- [SQL-content op Microsoft Learn](https://docs.microsoft.com/learn/browse/?products=azure-sql-database%2Csql-server&expanded=azure&WT.mc_id=academic-77958-bethanycheum)
+
+## Opdracht
+
+[Opdracht Titel](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/2-Working-With-Data/05-relational-databases/assignment.md b/translations/nl/2-Working-With-Data/05-relational-databases/assignment.md
new file mode 100644
index 00000000..3a90396a
--- /dev/null
+++ b/translations/nl/2-Working-With-Data/05-relational-databases/assignment.md
@@ -0,0 +1,73 @@
+
+# Luchthavendata weergeven
+
+Je hebt een [database](https://raw.githubusercontent.com/Microsoft/Data-Science-For-Beginners/main/2-Working-With-Data/05-relational-databases/airports.db) gekregen die is gebouwd op [SQLite](https://sqlite.org/index.html) en informatie over luchthavens bevat. Het schema wordt hieronder weergegeven. Je zult de [SQLite-extensie](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) in [Visual Studio Code](https://code.visualstudio.com?WT.mc_id=academic-77958-bethanycheum) gebruiken om informatie over luchthavens in verschillende steden weer te geven.
+
+## Instructies
+
+Om aan de opdracht te beginnen, moet je een paar stappen uitvoeren. Je zult wat tools moeten installeren en de voorbeelddatabase downloaden.
+
+### Stel je systeem in
+
+Je kunt Visual Studio Code en de SQLite-extensie gebruiken om met de database te werken.
+
+1. Ga naar [code.visualstudio.com](https://code.visualstudio.com?WT.mc_id=academic-77958-bethanycheum) en volg de instructies om Visual Studio Code te installeren
+1. Installeer de [SQLite-extensie](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) zoals beschreven op de Marketplace-pagina
+
+### Download en open de database
+
+Vervolgens download en open je de database.
+
+1. Download het [databasebestand van GitHub](https://raw.githubusercontent.com/Microsoft/Data-Science-For-Beginners/main/2-Working-With-Data/05-relational-databases/airports.db) en sla het op in een map
+1. Open Visual Studio Code
+1. Open de database in de SQLite-extensie door **Ctl-Shift-P** (of **Cmd-Shift-P** op een Mac) te selecteren en `SQLite: Open database` te typen
+1. Selecteer **Choose database from file** en open het **airports.db**-bestand dat je eerder hebt gedownload
+1. Nadat je de database hebt geopend (je ziet geen update op het scherm), maak je een nieuw queryvenster door **Ctl-Shift-P** (of **Cmd-Shift-P** op een Mac) te selecteren en `SQLite: New query` te typen
+
+Eenmaal geopend, kan het nieuwe queryvenster worden gebruikt om SQL-instructies uit te voeren op de database. Je kunt de opdracht **Ctl-Shift-Q** (of **Cmd-Shift-Q** op een Mac) gebruiken om queries uit te voeren op de database.
+
+> [!NOTE] Voor meer informatie over de SQLite-extensie kun je de [documentatie](https://marketplace.visualstudio.com/items?itemName=alexcvzz.vscode-sqlite&WT.mc_id=academic-77958-bethanycheum) raadplegen.
+
+## Databaseschema
+
+Het schema van een database is het ontwerp en de structuur van de tabellen. De **airports**-database heeft twee tabellen: `cities`, die een lijst bevat van steden in het Verenigd Koninkrijk en Ierland, en `airports`, die de lijst van alle luchthavens bevat. Omdat sommige steden meerdere luchthavens kunnen hebben, zijn er twee tabellen gemaakt om de informatie op te slaan. In deze oefening gebruik je joins om informatie voor verschillende steden weer te geven.
+
+| Cities |
+| ---------------- |
+| id (PK, integer) |
+| city (text) |
+| country (text) |
+
+| Airports |
+| -------------------------------- |
+| id (PK, integer) |
+| name (text) |
+| code (text) |
+| city_id (FK naar id in **Cities**) |
+
+## Opdracht
+
+Maak queries om de volgende informatie op te halen:
+
+1. alle stadsnamen in de `Cities`-tabel
+1. alle steden in Ierland in de `Cities`-tabel
+1. alle luchthavenamen met hun stad en land
+1. alle luchthavens in Londen, Verenigd Koninkrijk
+
+## Beoordelingscriteria
+
+| Uitmuntend | Voldoende | Verbetering nodig |
+| ---------- | --------- | ----------------- |
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/2-Working-With-Data/06-non-relational/README.md b/translations/nl/2-Working-With-Data/06-non-relational/README.md
new file mode 100644
index 00000000..2ca117ec
--- /dev/null
+++ b/translations/nl/2-Working-With-Data/06-non-relational/README.md
@@ -0,0 +1,158 @@
+
+# Werken met Gegevens: Niet-Relationele Gegevens
+
+| ](../../sketchnotes/06-NoSQL.png)|
+|:---:|
+|Werken met NoSQL-gegevens - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+## [Quiz voor de Les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/10)
+
+Gegevens zijn niet beperkt tot relationele databases. Deze les richt zich op niet-relationele gegevens en behandelt de basis van spreadsheets en NoSQL.
+
+## Spreadsheets
+
+Spreadsheets zijn een populaire manier om gegevens op te slaan en te verkennen, omdat het minder werk vereist om op te zetten en te beginnen. In deze les leer je de basisonderdelen van een spreadsheet, evenals formules en functies. De voorbeelden worden geïllustreerd met Microsoft Excel, maar de meeste onderdelen en onderwerpen hebben vergelijkbare namen en stappen in vergelijking met andere spreadsheetsoftware.
+
+
+
+Een spreadsheet is een bestand en zal toegankelijk zijn in het bestandssysteem van een computer, apparaat of cloudgebaseerd bestandssysteem. De software zelf kan browsergebaseerd zijn of een applicatie die op een computer moet worden geïnstalleerd of als app moet worden gedownload. In Excel worden deze bestanden ook gedefinieerd als **werkboeken**, en deze terminologie zal in de rest van deze les worden gebruikt.
+
+Een werkboek bevat een of meer **werkbladen**, waarbij elk werkblad wordt aangeduid met tabbladen. Binnen een werkblad bevinden zich rechthoeken genaamd **cellen**, die de daadwerkelijke gegevens bevatten. Een cel is het snijpunt van een rij en een kolom, waarbij de kolommen worden aangeduid met alfabetische tekens en de rijen numeriek worden aangeduid. Sommige spreadsheets bevatten kopteksten in de eerste paar rijen om de gegevens in een cel te beschrijven.
+
+Met deze basiselementen van een Excel-werkboek gebruiken we een voorbeeld van [Microsoft Templates](https://templates.office.com/) gericht op een inventaris om enkele aanvullende onderdelen van een spreadsheet door te nemen.
+
+### Beheren van een Inventaris
+
+Het spreadsheetbestand genaamd "InventoryExample" is een geformatteerde spreadsheet van items binnen een inventaris die drie werkbladen bevat, waarbij de tabbladen zijn gelabeld als "Inventory List", "Inventory Pick List" en "Bin Lookup". Rij 4 van het werkblad Inventory List is de koptekst, die de waarde van elke cel in de koptekstkolom beschrijft.
+
+
+
+Er zijn gevallen waarin een cel afhankelijk is van de waarden van andere cellen om zijn waarde te genereren. De spreadsheet Inventory List houdt de kosten van elk item in de inventaris bij, maar wat als we de waarde van alles in de inventaris willen weten? [**Formules**](https://support.microsoft.com/en-us/office/overview-of-formulas-34519a4e-1e8d-4f4b-84d4-d642c4f63263) voeren acties uit op celgegevens en worden in dit voorbeeld gebruikt om de kosten van de inventaris te berekenen. Deze spreadsheet gebruikte een formule in de kolom Inventory Value om de waarde van elk item te berekenen door de hoeveelheid onder de koptekst QTY te vermenigvuldigen met de kosten onder de koptekst COST. Door te dubbelklikken of een cel te markeren, wordt de formule weergegeven. Je zult merken dat formules beginnen met een gelijkteken, gevolgd door de berekening of bewerking.
+
+
+
+We kunnen een andere formule gebruiken om alle waarden van Inventory Value bij elkaar op te tellen om de totale waarde te krijgen. Dit kan worden berekend door elke cel op te tellen, maar dat kan een tijdrovende taak zijn. Excel heeft [**functies**](https://support.microsoft.com/en-us/office/sum-function-043e1c7d-7726-4e80-8f32-07b23e057f89), of vooraf gedefinieerde formules om berekeningen uit te voeren op celwaarden. Functies vereisen argumenten, dit zijn de vereiste waarden die worden gebruikt om deze berekeningen uit te voeren. Wanneer functies meer dan één argument vereisen, moeten ze in een bepaalde volgorde worden vermeld, anders berekent de functie mogelijk niet de juiste waarde. Dit voorbeeld gebruikt de functie SOM, en gebruikt de waarden van Inventory Value als argument om het totaal te genereren dat wordt vermeld onder rij 3, kolom B (ook wel B3 genoemd).
+
+## NoSQL
+
+NoSQL is een overkoepelende term voor de verschillende manieren om niet-relationele gegevens op te slaan en kan worden geïnterpreteerd als "non-SQL", "niet-relationeel" of "niet alleen SQL". Deze soorten databasesystemen kunnen in vier typen worden gecategoriseerd.
+
+
+> Bron van [Michał Białecki Blog](https://www.michalbialecki.com/2018/03/18/azure-cosmos-db-key-value-database-cloud/)
+
+[Key-value](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#keyvalue-data-stores) databases koppelen unieke sleutels, die een unieke identificatie zijn die is gekoppeld aan een waarde. Deze paren worden opgeslagen met behulp van een [hashtabel](https://www.hackerearth.com/practice/data-structures/hash-tables/basics-of-hash-tables/tutorial/) met een geschikte hashfunctie.
+
+
+> Bron van [Microsoft](https://docs.microsoft.com/en-us/azure/cosmos-db/graph/graph-introduction#graph-database-by-example)
+
+[Graph](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#graph-data-stores) databases beschrijven relaties in gegevens en worden weergegeven als een verzameling knooppunten en randen. Een knooppunt vertegenwoordigt een entiteit, iets dat in de echte wereld bestaat, zoals een student of een bankafschrift. Randen vertegenwoordigen de relatie tussen twee entiteiten. Elk knooppunt en elke rand heeft eigenschappen die aanvullende informatie bieden over elk knooppunt en elke rand.
+
+
+
+[Kolomgebaseerde](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#columnar-data-stores) datastores organiseren gegevens in kolommen en rijen zoals een relationele datastructuur, maar elke kolom is verdeeld in groepen die kolomfamilies worden genoemd, waarbij alle gegevens onder één kolom gerelateerd zijn en in één keer kunnen worden opgehaald en gewijzigd.
+
+### Documentdatastores met Azure Cosmos DB
+
+[Document](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data#document-data-stores) datastores bouwen voort op het concept van een key-value datastore en bestaan uit een reeks velden en objecten. Dit gedeelte verkent documentdatabases met de Cosmos DB-emulator.
+
+Een Cosmos DB-database past binnen de definitie van "Niet Alleen SQL", waarbij de documentdatabase van Cosmos DB afhankelijk is van SQL om de gegevens te bevragen. De [vorige les](../05-relational-databases/README.md) over SQL behandelt de basis van de taal, en we kunnen enkele van dezelfde queries toepassen op een documentdatabase hier. We gebruiken de Cosmos DB Emulator, waarmee we een documentdatabase lokaal op een computer kunnen maken en verkennen. Lees meer over de Emulator [hier](https://docs.microsoft.com/en-us/azure/cosmos-db/local-emulator?tabs=ssl-netstd21).
+
+Een document is een verzameling velden en objectwaarden, waarbij de velden beschrijven wat de objectwaarde vertegenwoordigt. Hieronder staat een voorbeeld van een document.
+
+```json
+{
+ "firstname": "Eva",
+ "age": 44,
+ "id": "8c74a315-aebf-4a16-bb38-2430a9896ce5",
+ "_rid": "bHwDAPQz8s0BAAAAAAAAAA==",
+ "_self": "dbs/bHwDAA==/colls/bHwDAPQz8s0=/docs/bHwDAPQz8s0BAAAAAAAAAA==/",
+ "_etag": "\"00000000-0000-0000-9f95-010a691e01d7\"",
+ "_attachments": "attachments/",
+ "_ts": 1630544034
+}
+```
+
+De velden van belang in dit document zijn: `firstname`, `id` en `age`. De rest van de velden met de underscores zijn gegenereerd door Cosmos DB.
+
+#### Gegevens Verkennen met de Cosmos DB Emulator
+
+Je kunt de emulator downloaden en installeren [voor Windows hier](https://aka.ms/cosmosdb-emulator). Raadpleeg deze [documentatie](https://docs.microsoft.com/en-us/azure/cosmos-db/local-emulator?tabs=ssl-netstd21#run-on-linux-macos) voor opties om de Emulator te draaien op macOS en Linux.
+
+De Emulator opent een browservenster, waar de Explorer-weergave je in staat stelt documenten te verkennen.
+
+
+
+Als je meedoet, klik dan op "Start with Sample" om een voorbeelddatabase genaamd SampleDB te genereren. Als je SampleDB uitvouwt door op de pijl te klikken, vind je een container genaamd `Persons`. Een container bevat een verzameling items, wat de documenten binnen de container zijn. Je kunt de vier individuele documenten onder `Items` verkennen.
+
+
+
+#### Documentgegevens Bevragen met de Cosmos DB Emulator
+
+We kunnen ook de voorbeeldgegevens bevragen door op de knop Nieuwe SQL-query te klikken (tweede knop van links).
+
+`SELECT * FROM c` retourneert alle documenten in de container. Laten we een where-clausule toevoegen en iedereen jonger dan 40 vinden.
+
+`SELECT * FROM c where c.age < 40`
+
+
+
+De query retourneert twee documenten. Let op dat de leeftijdswaarde voor elk document kleiner is dan 40.
+
+#### JSON en Documenten
+
+Als je bekend bent met JavaScript Object Notation (JSON), zul je merken dat documenten lijken op JSON. Er is een `PersonsData.json`-bestand in deze map met meer gegevens die je kunt uploaden naar de container `Persons` in de Emulator via de knop `Upload Item`.
+
+In de meeste gevallen kunnen API's die JSON-gegevens retourneren direct worden overgezet en opgeslagen in documentdatabases. Hieronder staat een ander document. Het vertegenwoordigt tweets van het Microsoft Twitter-account die zijn opgehaald met de Twitter API en vervolgens zijn ingevoerd in Cosmos DB.
+
+```json
+{
+ "created_at": "2021-08-31T19:03:01.000Z",
+ "id": "1432780985872142341",
+ "text": "Blank slate. Like this tweet if you’ve ever painted in Microsoft Paint before. https://t.co/cFeEs8eOPK",
+ "_rid": "dhAmAIUsA4oHAAAAAAAAAA==",
+ "_self": "dbs/dhAmAA==/colls/dhAmAIUsA4o=/docs/dhAmAIUsA4oHAAAAAAAAAA==/",
+ "_etag": "\"00000000-0000-0000-9f84-a0958ad901d7\"",
+ "_attachments": "attachments/",
+ "_ts": 1630537000
+```
+
+De velden van belang in dit document zijn: `created_at`, `id` en `text`.
+
+## 🚀 Uitdaging
+
+Er is een `TwitterData.json`-bestand dat je kunt uploaden naar de SampleDB-database. Het wordt aanbevolen om dit toe te voegen aan een aparte container. Dit kan worden gedaan door:
+
+1. Op de knop Nieuwe container in de rechterbovenhoek te klikken
+1. De bestaande database (SampleDB) te selecteren en een container-id voor de container te maken
+1. De partitiesleutel in te stellen op `/id`
+1. Op OK te klikken (je kunt de rest van de informatie in deze weergave negeren, aangezien dit een kleine dataset is die lokaal op je machine draait)
+1. Je nieuwe container te openen en het TwitterData-bestand te uploaden met de knop `Upload Item`
+
+Probeer een paar select-queries uit te voeren om de documenten te vinden die Microsoft in het tekstveld hebben. Tip: probeer het [LIKE-keyword](https://docs.microsoft.com/en-us/azure/cosmos-db/sql/sql-query-keywords#using-like-with-the--wildcard-character) te gebruiken.
+
+## [Quiz na de Les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/11)
+
+## Herhaling & Zelfstudie
+
+- Er zijn enkele extra opmaakopties en functies toegevoegd aan deze spreadsheet die in deze les niet worden behandeld. Microsoft heeft een [grote bibliotheek met documentatie en video's](https://support.microsoft.com/excel) over Excel als je meer wilt leren.
+
+- Deze architectuurdocumentatie beschrijft de kenmerken van de verschillende typen niet-relationele gegevens: [Niet-relationele Gegevens en NoSQL](https://docs.microsoft.com/en-us/azure/architecture/data-guide/big-data/non-relational-data)
+
+- Cosmos DB is een cloudgebaseerde niet-relationele database die ook de verschillende NoSQL-typen kan opslaan die in deze les worden genoemd. Leer meer over deze typen in deze [Cosmos DB Microsoft Learn Module](https://docs.microsoft.com/en-us/learn/paths/work-with-nosql-data-in-azure-cosmos-db/)
+
+## Opdracht
+
+[Soda Profits](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/2-Working-With-Data/06-non-relational/assignment.md b/translations/nl/2-Working-With-Data/06-non-relational/assignment.md
new file mode 100644
index 00000000..f7d4b62c
--- /dev/null
+++ b/translations/nl/2-Working-With-Data/06-non-relational/assignment.md
@@ -0,0 +1,33 @@
+
+# Soda Winst
+
+## Instructies
+
+De [Coca Cola Co spreadsheet](../../../../2-Working-With-Data/06-non-relational/CocaColaCo.xlsx) mist enkele berekeningen. Jouw taak is om:
+
+1. De brutowinst van FY '15, '16, '17 en '18 te berekenen
+ - Brutowinst = Netto operationele inkomsten - Kosten van verkochte goederen
+1. Het gemiddelde van alle brutowinsten te berekenen. Probeer dit te doen met een functie.
+ - Gemiddelde = Som van brutowinsten gedeeld door het aantal fiscale jaren (10)
+ - Documentatie over de [AVERAGE functie](https://support.microsoft.com/en-us/office/average-function-047bac88-d466-426c-a32b-8f33eb960cf6)
+1. Dit is een Excel-bestand, maar het zou bewerkbaar moeten zijn in elk spreadsheetplatform
+
+[Data bron credit aan Yiyi Wang](https://www.kaggle.com/yiyiwang0826/cocacola-excel)
+
+## Rubriek
+
+Uitmuntend | Voldoende | Moet Verbeteren
+--- | --- | --- |
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/2-Working-With-Data/07-python/README.md b/translations/nl/2-Working-With-Data/07-python/README.md
new file mode 100644
index 00000000..85930190
--- /dev/null
+++ b/translations/nl/2-Working-With-Data/07-python/README.md
@@ -0,0 +1,292 @@
+
+# Werken met Data: Python en de Pandas-bibliotheek
+
+|  ](../../sketchnotes/07-WorkWithPython.png) |
+| :-------------------------------------------------------------------------------------------------------: |
+| Werken met Python - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+[](https://youtu.be/dZjWOGbsN4Y)
+
+Hoewel databases zeer efficiënte manieren bieden om gegevens op te slaan en te raadplegen met behulp van querytalen, is de meest flexibele manier van gegevensverwerking het schrijven van je eigen programma om gegevens te manipuleren. In veel gevallen is een databasequery een effectievere oplossing. Maar in sommige gevallen, wanneer complexere gegevensverwerking nodig is, kan dit niet eenvoudig met SQL worden gedaan.
+Gegevensverwerking kan worden geprogrammeerd in elke programmeertaal, maar er zijn bepaalde talen die beter geschikt zijn voor het werken met data. Datawetenschappers geven meestal de voorkeur aan een van de volgende talen:
+
+* **[Python](https://www.python.org/)**, een algemene programmeertaal die vaak wordt beschouwd als een van de beste opties voor beginners vanwege de eenvoud. Python heeft veel extra bibliotheken die je kunnen helpen bij het oplossen van praktische problemen, zoals het extraheren van gegevens uit een ZIP-archief of het converteren van een afbeelding naar grijstinten. Naast datawetenschap wordt Python ook vaak gebruikt voor webontwikkeling.
+* **[R](https://www.r-project.org/)** is een traditionele toolbox die is ontwikkeld met statistische gegevensverwerking in gedachten. Het bevat ook een grote bibliotheekrepository (CRAN), waardoor het een goede keuze is voor gegevensverwerking. R is echter geen algemene programmeertaal en wordt zelden buiten het domein van datawetenschap gebruikt.
+* **[Julia](https://julialang.org/)** is een andere taal die specifiek is ontwikkeld voor datawetenschap. Het is bedoeld om betere prestaties te leveren dan Python, waardoor het een geweldig hulpmiddel is voor wetenschappelijke experimenten.
+
+In deze les richten we ons op het gebruik van Python voor eenvoudige gegevensverwerking. We gaan ervan uit dat je enige basiskennis van de taal hebt. Als je een diepgaandere kennismaking met Python wilt, kun je een van de volgende bronnen raadplegen:
+
+* [Leer Python op een leuke manier met Turtle Graphics en Fractals](https://github.com/shwars/pycourse) - GitHub-gebaseerde snelle introductiecursus in Python-programmering
+* [Zet je eerste stappen met Python](https://docs.microsoft.com/en-us/learn/paths/python-first-steps/?WT.mc_id=academic-77958-bethanycheum) Leerpad op [Microsoft Learn](http://learn.microsoft.com/?WT.mc_id=academic-77958-bethanycheum)
+
+Gegevens kunnen in veel vormen voorkomen. In deze les behandelen we drie vormen van gegevens - **tabulaire gegevens**, **tekst** en **afbeeldingen**.
+
+We richten ons op een paar voorbeelden van gegevensverwerking, in plaats van een volledig overzicht te geven van alle gerelateerde bibliotheken. Dit stelt je in staat om het belangrijkste idee te begrijpen van wat mogelijk is en laat je met een begrip achter van waar je oplossingen kunt vinden voor je problemen wanneer je ze nodig hebt.
+
+> **Meest nuttige advies**. Wanneer je een bepaalde bewerking op gegevens moet uitvoeren waarvan je niet weet hoe je die moet doen, probeer er dan naar te zoeken op internet. [Stackoverflow](https://stackoverflow.com/) bevat meestal veel nuttige codevoorbeelden in Python voor veel typische taken.
+
+
+
+## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/12)
+
+## Tabulaire gegevens en Dataframes
+
+Je hebt al kennisgemaakt met tabulaire gegevens toen we het hadden over relationele databases. Wanneer je veel gegevens hebt die in verschillende gekoppelde tabellen zijn opgeslagen, is het zeker zinvol om SQL te gebruiken om ermee te werken. Er zijn echter veel gevallen waarin we een tabel met gegevens hebben en we **inzicht** of **begrip** willen krijgen over deze gegevens, zoals de verdeling, correlatie tussen waarden, enz. In datawetenschap zijn er veel gevallen waarin we enkele transformaties van de oorspronkelijke gegevens moeten uitvoeren, gevolgd door visualisatie. Beide stappen kunnen eenvoudig worden uitgevoerd met Python.
+
+Er zijn twee meest bruikbare bibliotheken in Python die je kunnen helpen bij het werken met tabulaire gegevens:
+* **[Pandas](https://pandas.pydata.org/)** stelt je in staat om zogenaamde **Dataframes** te manipuleren, die analoog zijn aan relationele tabellen. Je kunt benoemde kolommen hebben en verschillende bewerkingen uitvoeren op rijen, kolommen en dataframes in het algemeen.
+* **[Numpy](https://numpy.org/)** is een bibliotheek voor het werken met **tensors**, oftewel multidimensionale **arrays**. Een array heeft waarden van hetzelfde onderliggende type en is eenvoudiger dan een dataframe, maar biedt meer wiskundige bewerkingen en creëert minder overhead.
+
+Er zijn ook een paar andere bibliotheken die je moet kennen:
+* **[Matplotlib](https://matplotlib.org/)** is een bibliotheek die wordt gebruikt voor gegevensvisualisatie en het plotten van grafieken
+* **[SciPy](https://www.scipy.org/)** is een bibliotheek met enkele aanvullende wetenschappelijke functies. We zijn deze bibliotheek al tegengekomen toen we het hadden over kansberekening en statistiek
+
+Hier is een stukje code dat je meestal zou gebruiken om deze bibliotheken aan het begin van je Python-programma te importeren:
+```python
+import numpy as np
+import pandas as pd
+import matplotlib.pyplot as plt
+from scipy import ... # you need to specify exact sub-packages that you need
+```
+
+Pandas draait om een paar basisconcepten.
+
+### Series
+
+**Series** is een reeks waarden, vergelijkbaar met een lijst of numpy-array. Het belangrijkste verschil is dat een series ook een **index** heeft, en wanneer we bewerkingen uitvoeren op series (bijv. ze optellen), wordt rekening gehouden met de index. De index kan zo eenvoudig zijn als een geheel getal (dit is de standaardindex die wordt gebruikt bij het maken van een series vanuit een lijst of array), of het kan een complexe structuur hebben, zoals een datumbereik.
+
+> **Opmerking**: Er is wat introductiecode voor Pandas in het bijbehorende notebook [`notebook.ipynb`](notebook.ipynb). We schetsen hier slechts enkele voorbeelden, en je bent zeker welkom om het volledige notebook te bekijken.
+
+Laten we een voorbeeld bekijken: we willen de verkoop van onze ijssalon analyseren. Laten we een reeks verkoopcijfers genereren (aantal verkochte items per dag) voor een bepaalde periode:
+
+```python
+start_date = "Jan 1, 2020"
+end_date = "Mar 31, 2020"
+idx = pd.date_range(start_date,end_date)
+print(f"Length of index is {len(idx)}")
+items_sold = pd.Series(np.random.randint(25,50,size=len(idx)),index=idx)
+items_sold.plot()
+```
+
+
+Stel nu dat we elke week een feestje organiseren voor vrienden en we nemen 10 extra pakken ijs mee voor het feestje. We kunnen een andere series maken, geïndexeerd per week, om dat te laten zien:
+```python
+additional_items = pd.Series(10,index=pd.date_range(start_date,end_date,freq="W"))
+```
+Wanneer we twee series optellen, krijgen we het totaal aantal:
+```python
+total_items = items_sold.add(additional_items,fill_value=0)
+total_items.plot()
+```
+
+
+> **Opmerking** dat we niet de eenvoudige syntaxis `total_items+additional_items` gebruiken. Als we dat deden, zouden we veel `NaN` (*Not a Number*)-waarden krijgen in de resulterende series. Dit komt omdat er ontbrekende waarden zijn voor sommige indexpunten in de `additional_items`-series, en het optellen van `NaN` met iets resulteert in `NaN`. Daarom moeten we de parameter `fill_value` specificeren tijdens het optellen.
+
+Met tijdreeksen kunnen we ook **herbemonsteren** met verschillende tijdsintervallen. Bijvoorbeeld, stel dat we het gemiddelde verkoopvolume maandelijks willen berekenen. We kunnen de volgende code gebruiken:
+```python
+monthly = total_items.resample("1M").mean()
+ax = monthly.plot(kind='bar')
+```
+
+
+### DataFrame
+
+Een DataFrame is in wezen een verzameling series met dezelfde index. We kunnen meerdere series combineren tot een DataFrame:
+```python
+a = pd.Series(range(1,10))
+b = pd.Series(["I","like","to","play","games","and","will","not","change"],index=range(0,9))
+df = pd.DataFrame([a,b])
+```
+Dit zal een horizontale tabel creëren zoals deze:
+| | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
+| --- | --- | ---- | --- | --- | ------ | --- | ------ | ---- | ---- |
+| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
+| 1 | I | like | to | use | Python | and | Pandas | very | much |
+
+We kunnen ook series gebruiken als kolommen en kolomnamen specificeren met behulp van een woordenboek:
+```python
+df = pd.DataFrame({ 'A' : a, 'B' : b })
+```
+Dit geeft ons een tabel zoals deze:
+
+| | A | B |
+| --- | --- | ------ |
+| 0 | 1 | I |
+| 1 | 2 | like |
+| 2 | 3 | to |
+| 3 | 4 | use |
+| 4 | 5 | Python |
+| 5 | 6 | and |
+| 6 | 7 | Pandas |
+| 7 | 8 | very |
+| 8 | 9 | much |
+
+**Opmerking** dat we deze tabelindeling ook kunnen krijgen door de vorige tabel te transponeren, bijvoorbeeld door te schrijven
+```python
+df = pd.DataFrame([a,b]).T..rename(columns={ 0 : 'A', 1 : 'B' })
+```
+Hier betekent `.T` de operatie van het transponeren van het DataFrame, d.w.z. het wisselen van rijen en kolommen, en de `rename`-bewerking stelt ons in staat om kolommen te hernoemen om overeen te komen met het vorige voorbeeld.
+
+Hier zijn een paar van de belangrijkste bewerkingen die we kunnen uitvoeren op DataFrames:
+
+**Kolomselectie**. We kunnen individuele kolommen selecteren door `df['A']` te schrijven - deze bewerking retourneert een Series. We kunnen ook een subset van kolommen selecteren in een ander DataFrame door `df[['B','A']]` te schrijven - dit retourneert een ander DataFrame.
+
+**Filteren** van alleen bepaalde rijen op basis van criteria. Bijvoorbeeld, om alleen rijen met kolom `A` groter dan 5 te behouden, kunnen we schrijven `df[df['A']>5]`.
+
+> **Opmerking**: De manier waarop filteren werkt is als volgt. De expressie `df['A']<5` retourneert een booleaanse series, die aangeeft of de expressie `True` of `False` is voor elk element van de oorspronkelijke series `df['A']`. Wanneer een booleaanse series wordt gebruikt als index, retourneert het een subset van rijen in het DataFrame. Het is dus niet mogelijk om willekeurige Python-booleaanse expressies te gebruiken, bijvoorbeeld door `df[df['A']>5 and df['A']<7]` te schrijven, zou dit fout zijn. In plaats daarvan moet je een speciale `&`-bewerking gebruiken op booleaanse series, door te schrijven `df[(df['A']>5) & (df['A']<7)]` (*haakjes zijn hier belangrijk*).
+
+**Nieuwe berekenbare kolommen maken**. We kunnen eenvoudig nieuwe berekenbare kolommen maken voor ons DataFrame door intuïtieve expressies te gebruiken zoals deze:
+```python
+df['DivA'] = df['A']-df['A'].mean()
+```
+Dit voorbeeld berekent de afwijking van A ten opzichte van de gemiddelde waarde. Wat hier eigenlijk gebeurt, is dat we een series berekenen en deze vervolgens toewijzen aan de linkerzijde, waardoor een nieuwe kolom wordt gemaakt. Daarom kunnen we geen bewerkingen gebruiken die niet compatibel zijn met series, bijvoorbeeld de onderstaande code is fout:
+```python
+# Wrong code -> df['ADescr'] = "Low" if df['A'] < 5 else "Hi"
+df['LenB'] = len(df['B']) # <- Wrong result
+```
+Het laatste voorbeeld, hoewel syntactisch correct, geeft ons een verkeerd resultaat, omdat het de lengte van de series `B` toewijst aan alle waarden in de kolom, en niet de lengte van individuele elementen zoals we bedoeld hadden.
+
+Als we complexe expressies zoals deze moeten berekenen, kunnen we de functie `apply` gebruiken. Het laatste voorbeeld kan als volgt worden geschreven:
+```python
+df['LenB'] = df['B'].apply(lambda x : len(x))
+# or
+df['LenB'] = df['B'].apply(len)
+```
+
+Na bovenstaande bewerkingen eindigen we met het volgende DataFrame:
+
+| | A | B | DivA | LenB |
+| --- | --- | ------ | ---- | ---- |
+| 0 | 1 | I | -4.0 | 1 |
+| 1 | 2 | like | -3.0 | 4 |
+| 2 | 3 | to | -2.0 | 2 |
+| 3 | 4 | use | -1.0 | 3 |
+| 4 | 5 | Python | 0.0 | 6 |
+| 5 | 6 | and | 1.0 | 3 |
+| 6 | 7 | Pandas | 2.0 | 6 |
+| 7 | 8 | very | 3.0 | 4 |
+| 8 | 9 | much | 4.0 | 4 |
+
+**Rijen selecteren op basis van nummers** kan worden gedaan met behulp van de `iloc`-constructie. Bijvoorbeeld, om de eerste 5 rijen uit het DataFrame te selecteren:
+```python
+df.iloc[:5]
+```
+
+**Groeperen** wordt vaak gebruikt om een resultaat te krijgen dat lijkt op *draaitabellen* in Excel. Stel dat we de gemiddelde waarde van kolom `A` willen berekenen voor elk gegeven aantal `LenB`. Dan kunnen we ons DataFrame groeperen op `LenB` en `mean` aanroepen:
+```python
+df.groupby(by='LenB').mean()
+```
+Als we het gemiddelde en het aantal elementen in de groep willen berekenen, kunnen we een meer complexe `aggregate`-functie gebruiken:
+```python
+df.groupby(by='LenB') \
+ .aggregate({ 'DivA' : len, 'A' : lambda x: x.mean() }) \
+ .rename(columns={ 'DivA' : 'Count', 'A' : 'Mean'})
+```
+Dit geeft ons de volgende tabel:
+
+| LenB | Count | Mean |
+| ---- | ----- | -------- |
+| 1 | 1 | 1.000000 |
+| 2 | 1 | 3.000000 |
+| 3 | 2 | 5.000000 |
+| 4 | 3 | 6.333333 |
+| 6 | 2 | 6.000000 |
+
+### Gegevens verkrijgen
+We hebben gezien hoe eenvoudig het is om Series en DataFrames te maken van Python-objecten. Data komt echter meestal in de vorm van een tekstbestand of een Excel-tabel. Gelukkig biedt Pandas ons een eenvoudige manier om data van de schijf te laden. Bijvoorbeeld, het lezen van een CSV-bestand is zo simpel als dit:
+```python
+df = pd.read_csv('file.csv')
+```
+We zullen meer voorbeelden zien van het laden van data, inclusief het ophalen van data van externe websites, in de sectie "Challenge".
+
+### Printen en Plotten
+
+Een Data Scientist moet vaak de data verkennen, dus het is belangrijk om deze te kunnen visualiseren. Wanneer een DataFrame groot is, willen we vaak alleen controleren of we alles correct doen door de eerste paar rijen af te drukken. Dit kan worden gedaan door `df.head()` aan te roepen. Als je dit uitvoert vanuit Jupyter Notebook, wordt het DataFrame weergegeven in een mooie tabelvorm.
+
+We hebben ook het gebruik van de `plot`-functie gezien om enkele kolommen te visualiseren. Hoewel `plot` erg nuttig is voor veel taken en verschillende grafiektypen ondersteunt via de `kind=`-parameter, kun je altijd de ruwe `matplotlib`-bibliotheek gebruiken om iets complexers te plotten. We zullen data-visualisatie uitgebreid behandelen in aparte cursuslessen.
+
+Dit overzicht behandelt de belangrijkste concepten van Pandas, maar de bibliotheek is zeer uitgebreid en er zijn geen grenzen aan wat je ermee kunt doen! Laten we nu deze kennis toepassen om een specifiek probleem op te lossen.
+
+## 🚀 Challenge 1: Analyse van COVID-verspreiding
+
+Het eerste probleem waarop we ons zullen richten is het modelleren van de epidemische verspreiding van COVID-19. Om dat te doen, gebruiken we de data over het aantal geïnfecteerde personen in verschillende landen, verstrekt door het [Center for Systems Science and Engineering](https://systems.jhu.edu/) (CSSE) van [Johns Hopkins University](https://jhu.edu/). De dataset is beschikbaar in [deze GitHub-repository](https://github.com/CSSEGISandData/COVID-19).
+
+Omdat we willen demonstreren hoe je met data omgaat, nodigen we je uit om [`notebook-covidspread.ipynb`](notebook-covidspread.ipynb) te openen en deze van boven naar beneden te lezen. Je kunt ook cellen uitvoeren en enkele uitdagingen aangaan die we aan het einde voor je hebben achtergelaten.
+
+
+
+> Als je niet weet hoe je code uitvoert in Jupyter Notebook, bekijk dan [dit artikel](https://soshnikov.com/education/how-to-execute-notebooks-from-github/).
+
+## Werken met ongestructureerde data
+
+Hoewel data vaak in tabelvorm komt, moeten we in sommige gevallen werken met minder gestructureerde data, zoals tekst of afbeeldingen. In dat geval moeten we, om de dataverwerkingstechnieken die we hierboven hebben gezien toe te passen, op de een of andere manier **gestructureerde** data **extraheren**. Hier zijn enkele voorbeelden:
+
+* Het extraheren van trefwoorden uit tekst en bekijken hoe vaak deze trefwoorden voorkomen
+* Het gebruik van neurale netwerken om informatie over objecten op een afbeelding te extraheren
+* Het verkrijgen van informatie over emoties van mensen via een videofeed van een camera
+
+## 🚀 Challenge 2: Analyse van COVID-papers
+
+In deze uitdaging blijven we bij het onderwerp van de COVID-pandemie en richten we ons op het verwerken van wetenschappelijke papers over het onderwerp. Er is een [CORD-19 Dataset](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge) met meer dan 7000 (op het moment van schrijven) papers over COVID, beschikbaar met metadata en samenvattingen (en voor ongeveer de helft is ook de volledige tekst beschikbaar).
+
+Een volledig voorbeeld van het analyseren van deze dataset met behulp van de [Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health/?WT.mc_id=academic-77958-bethanycheum) cognitieve service wordt beschreven [in deze blogpost](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/). We zullen een vereenvoudigde versie van deze analyse bespreken.
+
+> **NOTE**: We bieden geen kopie van de dataset als onderdeel van deze repository. Je moet mogelijk eerst het bestand [`metadata.csv`](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge?select=metadata.csv) downloaden van [deze dataset op Kaggle](https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge). Registratie bij Kaggle kan vereist zijn. Je kunt de dataset ook zonder registratie downloaden [van hier](https://ai2-semanticscholar-cord-19.s3-us-west-2.amazonaws.com/historical_releases.html), maar deze bevat alle volledige teksten naast het metadata-bestand.
+
+Open [`notebook-papers.ipynb`](notebook-papers.ipynb) en lees deze van boven naar beneden. Je kunt ook cellen uitvoeren en enkele uitdagingen aangaan die we aan het einde voor je hebben achtergelaten.
+
+
+
+## Verwerken van afbeeldingsdata
+
+Recent zijn zeer krachtige AI-modellen ontwikkeld die ons in staat stellen afbeeldingen te begrijpen. Er zijn veel taken die kunnen worden opgelost met behulp van vooraf getrainde neurale netwerken of clouddiensten. Enkele voorbeelden zijn:
+
+* **Afbeeldingsclassificatie**, waarmee je een afbeelding kunt categoriseren in een van de vooraf gedefinieerde klassen. Je kunt eenvoudig je eigen afbeeldingsclassificators trainen met diensten zoals [Custom Vision](https://azure.microsoft.com/services/cognitive-services/custom-vision-service/?WT.mc_id=academic-77958-bethanycheum).
+* **Objectdetectie** om verschillende objecten in een afbeelding te detecteren. Diensten zoals [Computer Vision](https://azure.microsoft.com/services/cognitive-services/computer-vision/?WT.mc_id=academic-77958-bethanycheum) kunnen een aantal veelvoorkomende objecten detecteren, en je kunt een [Custom Vision](https://azure.microsoft.com/services/cognitive-services/custom-vision-service/?WT.mc_id=academic-77958-bethanycheum)-model trainen om specifieke objecten van interesse te detecteren.
+* **Gezichtsdetectie**, inclusief leeftijd-, geslacht- en emotiedetectie. Dit kan worden gedaan via [Face API](https://azure.microsoft.com/services/cognitive-services/face/?WT.mc_id=academic-77958-bethanycheum).
+
+Al deze clouddiensten kunnen worden aangeroepen met [Python SDKs](https://docs.microsoft.com/samples/azure-samples/cognitive-services-python-sdk-samples/cognitive-services-python-sdk-samples/?WT.mc_id=academic-77958-bethanycheum) en kunnen dus eenvoudig worden geïntegreerd in je data-exploratieworkflow.
+
+Hier zijn enkele voorbeelden van het verkennen van data uit afbeeldingsbronnen:
+* In de blogpost [Hoe Data Science leren zonder te programmeren](https://soshnikov.com/azure/how-to-learn-data-science-without-coding/) verkennen we Instagram-foto's om te begrijpen wat mensen ertoe brengt meer likes te geven aan een foto. We extraheren eerst zoveel mogelijk informatie uit afbeeldingen met behulp van [Computer Vision](https://azure.microsoft.com/services/cognitive-services/computer-vision/?WT.mc_id=academic-77958-bethanycheum) en gebruiken vervolgens [Azure Machine Learning AutoML](https://docs.microsoft.com/azure/machine-learning/concept-automated-ml/?WT.mc_id=academic-77958-bethanycheum) om een interpreteerbaar model te bouwen.
+* In [Facial Studies Workshop](https://github.com/CloudAdvocacy/FaceStudies) gebruiken we [Face API](https://azure.microsoft.com/services/cognitive-services/face/?WT.mc_id=academic-77958-bethanycheum) om emoties van mensen op foto's van evenementen te extraheren, om te proberen te begrijpen wat mensen gelukkig maakt.
+
+## Conclusie
+
+Of je nu al gestructureerde of ongestructureerde data hebt, met Python kun je alle stappen uitvoeren die verband houden met dataverwerking en -begrip. Het is waarschijnlijk de meest flexibele manier van dataverwerking, en daarom gebruiken de meeste data scientists Python als hun primaire tool. Python diepgaand leren is waarschijnlijk een goed idee als je serieus bent over je reis in data science!
+
+## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/13)
+
+## Review & Zelfstudie
+
+**Boeken**
+* [Wes McKinney. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython](https://www.amazon.com/gp/product/1491957662)
+
+**Online bronnen**
+* Officiële [10 minuten naar Pandas](https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html) tutorial
+* [Documentatie over Pandas-visualisatie](https://pandas.pydata.org/pandas-docs/stable/user_guide/visualization.html)
+
+**Python leren**
+* [Leer Python op een leuke manier met Turtle Graphics en fractals](https://github.com/shwars/pycourse)
+* [Zet je eerste stappen met Python](https://docs.microsoft.com/learn/paths/python-first-steps/?WT.mc_id=academic-77958-bethanycheum) Leerpad op [Microsoft Learn](http://learn.microsoft.com/?WT.mc_id=academic-77958-bethanycheum)
+
+## Opdracht
+
+[Voer een meer gedetailleerde datastudie uit voor de bovenstaande uitdagingen](assignment.md)
+
+## Credits
+
+Deze les is met ♥️ geschreven door [Dmitry Soshnikov](http://soshnikov.com)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/2-Working-With-Data/07-python/assignment.md b/translations/nl/2-Working-With-Data/07-python/assignment.md
new file mode 100644
index 00000000..4bd6151f
--- /dev/null
+++ b/translations/nl/2-Working-With-Data/07-python/assignment.md
@@ -0,0 +1,37 @@
+
+# Opdracht voor Gegevensverwerking in Python
+
+In deze opdracht vragen we je om verder te werken aan de code die we zijn begonnen te ontwikkelen in onze uitdagingen. De opdracht bestaat uit twee delen:
+
+## COVID-19 Verspreidingsmodellering
+
+ - [ ] Plot *R* grafieken voor 5-6 verschillende landen op één grafiek ter vergelijking, of gebruik meerdere grafieken naast elkaar.
+ - [ ] Bekijk hoe het aantal sterfgevallen en herstelde gevallen correleert met het aantal geïnfecteerde gevallen.
+ - [ ] Ontdek hoe lang een typische ziekte duurt door visueel de infectiegraad en sterftegraad te correleren en te zoeken naar enkele afwijkingen. Mogelijk moet je naar verschillende landen kijken om dit te achterhalen.
+ - [ ] Bereken het sterftecijfer en hoe dit in de loop van de tijd verandert. *Je wilt misschien rekening houden met de duur van de ziekte in dagen om een tijdreeks te verschuiven voordat je berekeningen uitvoert.*
+
+## Analyse van COVID-19 Artikelen
+
+- [ ] Bouw een co-occurrenciematrix van verschillende medicijnen en kijk welke medicijnen vaak samen voorkomen (d.w.z. genoemd worden in één samenvatting). Je kunt de code aanpassen voor het bouwen van een co-occurrenciematrix voor medicijnen en diagnoses.
+- [ ] Visualiseer deze matrix met behulp van een heatmap.
+- [ ] Als extra uitdaging, visualiseer de co-occurrence van medicijnen met behulp van een [chord diagram](https://en.wikipedia.org/wiki/Chord_diagram). [Deze bibliotheek](https://pypi.org/project/chord/) kan je helpen bij het tekenen van een chord diagram.
+- [ ] Als een andere extra uitdaging, haal doseringen van verschillende medicijnen op (zoals **400mg** in *neem dagelijks 400mg chloroquine*) met behulp van reguliere expressies, en bouw een dataframe dat verschillende doseringen voor verschillende medicijnen toont. **Let op**: overweeg numerieke waarden die zich in de nabije tekstuele omgeving van de medicijnnaam bevinden.
+
+## Beoordelingscriteria
+
+Uitmuntend | Voldoende | Verbetering Nodig
+--- | --- | -- |
+Alle taken zijn voltooid, grafisch geïllustreerd en uitgelegd, inclusief ten minste één van de twee extra uitdagingen | Meer dan 5 taken zijn voltooid, geen extra uitdagingen zijn geprobeerd, of de resultaten zijn niet duidelijk | Minder dan 5 (maar meer dan 3) taken zijn voltooid, visualisaties helpen niet om het punt te verduidelijken
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we ons best doen om nauwkeurigheid te waarborgen, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/2-Working-With-Data/08-data-preparation/README.md b/translations/nl/2-Working-With-Data/08-data-preparation/README.md
new file mode 100644
index 00000000..09fb43d8
--- /dev/null
+++ b/translations/nl/2-Working-With-Data/08-data-preparation/README.md
@@ -0,0 +1,346 @@
+
+# Werken met Data: Data Voorbereiding
+
+| ](../../sketchnotes/08-DataPreparation.png)|
+|:---:|
+|Data Voorbereiding - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+## [Pre-Lecture Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/14)
+
+Afhankelijk van de bron kan ruwe data inconsistenties bevatten die uitdagingen opleveren bij analyse en modellering. Met andere woorden, deze data kan worden gecategoriseerd als "vervuild" en moet worden opgeschoond. Deze les richt zich op technieken voor het opschonen en transformeren van data om uitdagingen zoals ontbrekende, onjuiste of onvolledige data aan te pakken. Onderwerpen in deze les maken gebruik van Python en de Pandas-bibliotheek en worden [gedemonstreerd in het notebook](notebook.ipynb) in deze map.
+
+## Het belang van het opschonen van data
+
+- **Gebruiksgemak en herbruikbaarheid**: Wanneer data goed georganiseerd en genormaliseerd is, is het eenvoudiger om te zoeken, te gebruiken en te delen met anderen.
+
+- **Consistentie**: Data science vereist vaak het werken met meerdere datasets, waarbij datasets uit verschillende bronnen moeten worden samengevoegd. Door ervoor te zorgen dat elke dataset een gemeenschappelijke standaardisatie heeft, blijft de data bruikbaar wanneer ze worden samengevoegd tot één dataset.
+
+- **Modelnauwkeurigheid**: Data die is opgeschoond, verbetert de nauwkeurigheid van modellen die ervan afhankelijk zijn.
+
+## Veelvoorkomende schoonmaakdoelen en strategieën
+
+- **Een dataset verkennen**: Data verkennen, wat wordt behandeld in een [latere les](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/4-Data-Science-Lifecycle/15-analyzing), kan je helpen om data te ontdekken die moet worden opgeschoond. Het visueel observeren van waarden binnen een dataset kan verwachtingen scheppen over hoe de rest eruit zal zien of een idee geven van de problemen die kunnen worden opgelost. Verkenning kan bestaan uit eenvoudige query's, visualisaties en steekproeven.
+
+- **Formatteren**: Afhankelijk van de bron kan data inconsistenties bevatten in hoe het wordt gepresenteerd. Dit kan problemen veroorzaken bij het zoeken naar en weergeven van waarden, waarbij de data wel zichtbaar is in de dataset, maar niet correct wordt weergegeven in visualisaties of queryresultaten. Veelvoorkomende formatteringsproblemen omvatten het oplossen van witruimtes, datums en datatypes. Het oplossen van formatteringsproblemen is meestal de verantwoordelijkheid van de gebruikers van de data. Bijvoorbeeld, standaarden voor hoe datums en getallen worden weergegeven, kunnen per land verschillen.
+
+- **Duplicaties**: Data die meer dan één keer voorkomt, kan onnauwkeurige resultaten opleveren en moet meestal worden verwijderd. Dit komt vaak voor bij het samenvoegen van twee of meer datasets. Er zijn echter gevallen waarin duplicaties in samengevoegde datasets extra informatie bevatten en mogelijk behouden moeten blijven.
+
+- **Ontbrekende data**: Ontbrekende data kan onnauwkeurigheden veroorzaken, evenals zwakke of bevooroordeelde resultaten. Soms kunnen deze worden opgelost door de data opnieuw te laden, de ontbrekende waarden in te vullen met berekeningen en code zoals Python, of simpelweg de waarde en bijbehorende data te verwijderen. Er zijn talloze redenen waarom data kan ontbreken, en de acties die worden ondernomen om deze ontbrekende waarden op te lossen, kunnen afhangen van hoe en waarom ze zijn verdwenen.
+
+## Informatie over DataFrames verkennen
+> **Leerdoel:** Aan het einde van deze subsectie moet je in staat zijn om algemene informatie over de data in pandas DataFrames te vinden.
+
+Zodra je je data hebt geladen in pandas, zal deze waarschijnlijk in een DataFrame staan (zie de vorige [les](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/07-python#dataframe) voor een gedetailleerd overzicht). Maar als de dataset in je DataFrame 60.000 rijen en 400 kolommen bevat, hoe begin je dan een idee te krijgen van waar je mee werkt? Gelukkig biedt [pandas](https://pandas.pydata.org/) handige tools om snel algemene informatie over een DataFrame te bekijken, naast de eerste en laatste paar rijen.
+
+Om deze functionaliteit te verkennen, importeren we de Python scikit-learn bibliotheek en gebruiken we een iconische dataset: de **Iris dataset**.
+
+```python
+import pandas as pd
+from sklearn.datasets import load_iris
+
+iris = load_iris()
+iris_df = pd.DataFrame(data=iris['data'], columns=iris['feature_names'])
+```
+| |sepal lengte (cm)|sepal breedte (cm)|petal lengte (cm)|petal breedte (cm)|
+|----------------------------------------|-----------------|------------------|-----------------|------------------|
+|0 |5.1 |3.5 |1.4 |0.2 |
+|1 |4.9 |3.0 |1.4 |0.2 |
+|2 |4.7 |3.2 |1.3 |0.2 |
+|3 |4.6 |3.1 |1.5 |0.2 |
+|4 |5.0 |3.6 |1.4 |0.2 |
+
+- **DataFrame.info**: Om te beginnen wordt de `info()`-methode gebruikt om een samenvatting van de inhoud in een `DataFrame` af te drukken. Laten we deze dataset bekijken om te zien wat we hebben:
+```python
+iris_df.info()
+```
+```
+RangeIndex: 150 entries, 0 to 149
+Data columns (total 4 columns):
+ # Column Non-Null Count Dtype
+--- ------ -------------- -----
+ 0 sepal length (cm) 150 non-null float64
+ 1 sepal width (cm) 150 non-null float64
+ 2 petal length (cm) 150 non-null float64
+ 3 petal width (cm) 150 non-null float64
+dtypes: float64(4)
+memory usage: 4.8 KB
+```
+Hieruit weten we dat de *Iris* dataset 150 items heeft in vier kolommen zonder lege waarden. Alle data is opgeslagen als 64-bits floating-point getallen.
+
+- **DataFrame.head()**: Vervolgens gebruiken we de `head()`-methode om de eerste paar rijen van onze `iris_df` te bekijken:
+```python
+iris_df.head()
+```
+```
+ sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
+0 5.1 3.5 1.4 0.2
+1 4.9 3.0 1.4 0.2
+2 4.7 3.2 1.3 0.2
+3 4.6 3.1 1.5 0.2
+4 5.0 3.6 1.4 0.2
+```
+- **DataFrame.tail()**: Omgekeerd gebruiken we de `tail()`-methode om de laatste paar rijen van de `DataFrame` te bekijken:
+```python
+iris_df.tail()
+```
+```
+ sepal length (cm) sepal width (cm) petal length (cm) petal width (cm)
+145 6.7 3.0 5.2 2.3
+146 6.3 2.5 5.0 1.9
+147 6.5 3.0 5.2 2.0
+148 6.2 3.4 5.4 2.3
+149 5.9 3.0 5.1 1.8
+```
+> **Conclusie:** Zelfs door alleen naar de metadata over de informatie in een DataFrame of de eerste en laatste paar waarden te kijken, kun je direct een idee krijgen van de grootte, vorm en inhoud van de data waarmee je werkt.
+
+## Omgaan met ontbrekende data
+> **Leerdoel:** Aan het einde van deze subsectie moet je weten hoe je null-waarden in DataFrames kunt vervangen of verwijderen.
+
+Meestal bevatten de datasets die je wilt gebruiken (of moet gebruiken) ontbrekende waarden. Hoe je met ontbrekende data omgaat, brengt subtiele afwegingen met zich mee die je uiteindelijke analyse en resultaten in de echte wereld kunnen beïnvloeden.
+
+Pandas gaat op twee manieren om met ontbrekende waarden. De eerste heb je al eerder gezien: `NaN`, of Not a Number. Dit is een speciale waarde die deel uitmaakt van de IEEE floating-point specificatie en wordt alleen gebruikt om ontbrekende floating-point waarden aan te geven.
+
+Voor ontbrekende waarden anders dan floats gebruikt pandas het Python `None`-object. Hoewel het verwarrend kan lijken dat je twee verschillende soorten waarden tegenkomt die in wezen hetzelfde zeggen, zijn er goede programmatische redenen voor dit ontwerp en stelt het pandas in staat om in de meeste gevallen een goede balans te bieden. Desondanks hebben zowel `None` als `NaN` beperkingen waarmee je rekening moet houden met betrekking tot hoe ze kunnen worden gebruikt.
+
+Lees meer over `NaN` en `None` in het [notebook](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/4-Data-Science-Lifecycle/15-analyzing/notebook.ipynb)!
+
+- **Null-waarden detecteren**: In `pandas` zijn de methoden `isnull()` en `notnull()` je primaire methoden om null-data te detecteren. Beide retourneren Booleaanse maskers over je data. We gebruiken `numpy` voor `NaN`-waarden:
+```python
+import numpy as np
+
+example1 = pd.Series([0, np.nan, '', None])
+example1.isnull()
+```
+```
+0 False
+1 True
+2 False
+3 True
+dtype: bool
+```
+Kijk goed naar de uitvoer. Verrast iets je? Hoewel `0` een aritmetische null is, is het toch een geldig geheel getal en pandas behandelt het als zodanig. `''` is iets subtieler. Hoewel we het in Sectie 1 gebruikten om een lege stringwaarde weer te geven, is het toch een stringobject en geen weergave van null volgens pandas.
+
+Laten we dit nu omdraaien en deze methoden gebruiken zoals je ze in de praktijk zult gebruiken. Je kunt Booleaanse maskers direct gebruiken als een ``Series`` of ``DataFrame``-index, wat handig kan zijn bij het werken met geïsoleerde ontbrekende (of aanwezige) waarden.
+
+> **Conclusie**: Zowel de `isnull()`- als de `notnull()`-methoden geven vergelijkbare resultaten wanneer je ze gebruikt in `DataFrame`s: ze tonen de resultaten en de index van die resultaten, wat je enorm zal helpen bij het werken met je data.
+
+- **Null-waarden verwijderen**: Naast het identificeren van ontbrekende waarden biedt pandas een handige manier om null-waarden te verwijderen uit `Series` en `DataFrame`s. (Bij grote datasets is het vaak verstandiger om ontbrekende [NA] waarden gewoon te verwijderen uit je analyse dan ze op andere manieren te verwerken.) Laten we dit in actie zien met `example1`:
+```python
+example1 = example1.dropna()
+example1
+```
+```
+0 0
+2
+dtype: object
+```
+Merk op dat dit eruit zou moeten zien als je uitvoer van `example3[example3.notnull()]`. Het verschil hier is dat, in plaats van alleen te indexeren op de gemaskeerde waarden, `dropna` die ontbrekende waarden heeft verwijderd uit de `Series` `example1`.
+
+Omdat `DataFrame`s twee dimensies hebben, bieden ze meer opties voor het verwijderen van data.
+
+```python
+example2 = pd.DataFrame([[1, np.nan, 7],
+ [2, 5, 8],
+ [np.nan, 6, 9]])
+example2
+```
+| | 0 | 1 | 2 |
+|------|---|---|---|
+|0 |1.0|NaN|7 |
+|1 |2.0|5.0|8 |
+|2 |NaN|6.0|9 |
+
+(Heb je opgemerkt dat pandas twee van de kolommen heeft omgezet naar floats om de `NaN`s te accommoderen?)
+
+Je kunt geen enkele waarde uit een `DataFrame` verwijderen, dus je moet volledige rijen of kolommen verwijderen. Afhankelijk van wat je doet, wil je misschien het een of het ander doen, en pandas geeft je opties voor beide. Omdat in data science kolommen meestal variabelen vertegenwoordigen en rijen observaties, ben je eerder geneigd om rijen data te verwijderen; de standaardinstelling voor `dropna()` is om alle rijen te verwijderen die null-waarden bevatten:
+
+```python
+example2.dropna()
+```
+```
+ 0 1 2
+1 2.0 5.0 8
+```
+Indien nodig kun je NA-waarden uit kolommen verwijderen. Gebruik `axis=1` om dit te doen:
+```python
+example2.dropna(axis='columns')
+```
+```
+ 2
+0 7
+1 8
+2 9
+```
+Merk op dat dit veel data kan verwijderen die je misschien wilt behouden, vooral in kleinere datasets. Wat als je alleen rijen of kolommen wilt verwijderen die meerdere of zelfs alle null-waarden bevatten? Je specificeert deze instellingen in `dropna` met de parameters `how` en `thresh`.
+
+Standaard is `how='any'` (als je dit zelf wilt controleren of wilt zien welke andere parameters de methode heeft, voer dan `example4.dropna?` uit in een codecel). Je kunt ook `how='all'` specificeren om alleen rijen of kolommen te verwijderen die volledig null-waarden bevatten. Laten we ons voorbeeld `DataFrame` uitbreiden om dit in actie te zien.
+
+```python
+example2[3] = np.nan
+example2
+```
+| |0 |1 |2 |3 |
+|------|---|---|---|---|
+|0 |1.0|NaN|7 |NaN|
+|1 |2.0|5.0|8 |NaN|
+|2 |NaN|6.0|9 |NaN|
+
+De parameter `thresh` geeft je fijnmazigere controle: je stelt het aantal *niet-null* waarden in dat een rij of kolom moet hebben om behouden te blijven:
+```python
+example2.dropna(axis='rows', thresh=3)
+```
+```
+ 0 1 2 3
+1 2.0 5.0 8 NaN
+```
+Hier zijn de eerste en laatste rij verwijderd, omdat ze slechts twee niet-null waarden bevatten.
+
+- **Null-waarden invullen**: Afhankelijk van je dataset kan het soms logischer zijn om null-waarden in te vullen met geldige waarden in plaats van ze te verwijderen. Je zou `isnull` kunnen gebruiken om dit ter plekke te doen, maar dat kan arbeidsintensief zijn, vooral als je veel waarden moet invullen. Omdat dit een veelvoorkomende taak is in data science, biedt pandas `fillna`, dat een kopie van de `Series` of `DataFrame` retourneert met de ontbrekende waarden vervangen door een waarde naar keuze. Laten we een andere voorbeeld `Series` maken om te zien hoe dit in de praktijk werkt.
+```python
+example3 = pd.Series([1, np.nan, 2, None, 3], index=list('abcde'))
+example3
+```
+```
+a 1.0
+b NaN
+c 2.0
+d NaN
+e 3.0
+dtype: float64
+```
+Je kunt alle null-items invullen met een enkele waarde, zoals `0`:
+```python
+example3.fillna(0)
+```
+```
+a 1.0
+b 0.0
+c 2.0
+d 0.0
+e 3.0
+dtype: float64
+```
+Je kunt null-waarden **voorwaarts invullen**, wat betekent dat je de laatste geldige waarde gebruikt om een null in te vullen:
+```python
+example3.fillna(method='ffill')
+```
+```
+a 1.0
+b 1.0
+c 2.0
+d 2.0
+e 3.0
+dtype: float64
+```
+Je kunt ook **achterwaarts invullen** om de volgende geldige waarde terug te propaganderen om een null in te vullen:
+```python
+example3.fillna(method='bfill')
+```
+```
+a 1.0
+b 2.0
+c 2.0
+d 3.0
+e 3.0
+dtype: float64
+```
+Zoals je misschien vermoedt, werkt dit hetzelfde met `DataFrame`s, maar je kunt ook een `axis` specificeren langs welke je null-waarden wilt invullen. Neem opnieuw het eerder gebruikte `example2`:
+```python
+example2.fillna(method='ffill', axis=1)
+```
+```
+ 0 1 2 3
+0 1.0 1.0 7.0 7.0
+1 2.0 5.0 8.0 8.0
+2 NaN 6.0 9.0 9.0
+```
+Merk op dat wanneer een vorige waarde niet beschikbaar is voor voorwaarts invullen, de null-waarde blijft staan.
+> **Belangrijk punt:** Er zijn meerdere manieren om om te gaan met ontbrekende waarden in je datasets. De specifieke strategie die je gebruikt (ze verwijderen, vervangen, of zelfs hoe je ze vervangt) moet worden bepaald door de specifieke kenmerken van die data. Je zult een beter gevoel ontwikkelen voor hoe je met ontbrekende waarden omgaat naarmate je meer datasets verwerkt en ermee werkt.
+
+## Duplicaatgegevens verwijderen
+
+> **Leerdoel:** Aan het einde van deze subsectie moet je in staat zijn om duplicaatwaarden in DataFrames te identificeren en te verwijderen.
+
+Naast ontbrekende data kom je in echte datasets vaak gedupliceerde data tegen. Gelukkig biedt `pandas` een eenvoudige manier om duplicaten te detecteren en te verwijderen.
+
+- **Duplicaten identificeren: `duplicated`**: Je kunt duplicaatwaarden eenvoudig opsporen met de `duplicated`-methode in pandas. Deze methode retourneert een Boolean-masker dat aangeeft of een invoer in een `DataFrame` een duplicaat is van een eerdere invoer. Laten we een ander voorbeeld-`DataFrame` maken om dit in actie te zien.
+```python
+example4 = pd.DataFrame({'letters': ['A','B'] * 2 + ['B'],
+ 'numbers': [1, 2, 1, 3, 3]})
+example4
+```
+| |letters|numbers|
+|------|-------|-------|
+|0 |A |1 |
+|1 |B |2 |
+|2 |A |1 |
+|3 |B |3 |
+|4 |B |3 |
+
+```python
+example4.duplicated()
+```
+```
+0 False
+1 False
+2 True
+3 False
+4 True
+dtype: bool
+```
+- **Duplicaten verwijderen: `drop_duplicates`:** retourneert simpelweg een kopie van de data waarbij alle `duplicated`-waarden `False` zijn:
+```python
+example4.drop_duplicates()
+```
+```
+ letters numbers
+0 A 1
+1 B 2
+3 B 3
+```
+Zowel `duplicated` als `drop_duplicates` beschouwen standaard alle kolommen, maar je kunt specificeren dat ze alleen een subset van kolommen in je `DataFrame` onderzoeken:
+```python
+example4.drop_duplicates(['letters'])
+```
+```
+letters numbers
+0 A 1
+1 B 2
+```
+
+> **Belangrijk punt:** Het verwijderen van duplicaatgegevens is een essentieel onderdeel van bijna elk data-scienceproject. Duplicaatgegevens kunnen de resultaten van je analyses veranderen en je onnauwkeurige resultaten geven!
+
+
+## 🚀 Uitdaging
+
+Alle besproken materialen zijn beschikbaar als een [Jupyter Notebook](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/2-Working-With-Data/08-data-preparation/notebook.ipynb). Daarnaast zijn er oefeningen na elke sectie, probeer ze eens uit!
+
+## [Post-Lecture Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/15)
+
+
+
+## Herziening & Zelfstudie
+
+Er zijn veel manieren om je data voor te bereiden op analyse en modellering, en het opschonen van data is een belangrijke stap die een "hands-on" ervaring vereist. Probeer deze uitdagingen van Kaggle om technieken te verkennen die in deze les niet zijn behandeld.
+
+- [Data Cleaning Challenge: Parsing Dates](https://www.kaggle.com/rtatman/data-cleaning-challenge-parsing-dates/)
+
+- [Data Cleaning Challenge: Scale and Normalize Data](https://www.kaggle.com/rtatman/data-cleaning-challenge-scale-and-normalize-data)
+
+
+## Opdracht
+
+[Gegevens evalueren van een formulier](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/2-Working-With-Data/08-data-preparation/assignment.md b/translations/nl/2-Working-With-Data/08-data-preparation/assignment.md
new file mode 100644
index 00000000..2cf6dc92
--- /dev/null
+++ b/translations/nl/2-Working-With-Data/08-data-preparation/assignment.md
@@ -0,0 +1,28 @@
+
+# Evalueren van gegevens uit een formulier
+
+Een klant heeft een [klein formulier](../../../../2-Working-With-Data/08-data-preparation/index.html) getest om wat basisgegevens over hun klantenbestand te verzamelen. Ze hebben hun bevindingen aan jou voorgelegd om de verzamelde gegevens te valideren. Je kunt de `index.html`-pagina in de browser openen om het formulier te bekijken.
+
+Je hebt een [dataset met csv-records](../../../../data/form.csv) ontvangen die inzendingen van het formulier bevat, evenals enkele basisvisualisaties. De klant heeft aangegeven dat sommige visualisaties er onjuist uitzien, maar ze weten niet zeker hoe ze dit moeten oplossen. Je kunt dit verder onderzoeken in het [assignment notebook](assignment.ipynb).
+
+## Instructies
+
+Gebruik de technieken uit deze les om aanbevelingen te doen over het formulier, zodat het nauwkeurige en consistente informatie vastlegt.
+
+## Rubriek
+
+Uitmuntend | Voldoende | Verbetering nodig
+--- | --- | ---
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/2-Working-With-Data/README.md b/translations/nl/2-Working-With-Data/README.md
new file mode 100644
index 00000000..4ed98929
--- /dev/null
+++ b/translations/nl/2-Working-With-Data/README.md
@@ -0,0 +1,31 @@
+
+# Werken met Data
+
+
+> Foto door Alexander Sinn op Unsplash
+
+In deze lessen leer je enkele manieren waarop data kan worden beheerd, gemanipuleerd en gebruikt in applicaties. Je leert over relationele en niet-relationele databases en hoe data daarin kan worden opgeslagen. Je leert de basisprincipes van werken met Python om data te beheren, en je ontdekt enkele van de vele manieren waarop je met Python data kunt beheren en analyseren.
+
+### Onderwerpen
+
+1. [Relationele databases](05-relational-databases/README.md)
+2. [Niet-relationele databases](06-non-relational/README.md)
+3. [Werken met Python](07-python/README.md)
+4. [Data voorbereiden](08-data-preparation/README.md)
+
+### Credits
+
+Deze lessen zijn met ❤️ geschreven door [Christopher Harrison](https://twitter.com/geektrainer), [Dmitry Soshnikov](https://twitter.com/shwars) en [Jasmine Greenaway](https://twitter.com/paladique)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/09-visualization-quantities/README.md b/translations/nl/3-Data-Visualization/09-visualization-quantities/README.md
new file mode 100644
index 00000000..92b30b8d
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/09-visualization-quantities/README.md
@@ -0,0 +1,217 @@
+
+# Hoe hoeveelheden te visualiseren
+
+| ](../../sketchnotes/09-Visualizing-Quantities.png)|
+|:---:|
+| Hoe hoeveelheden te visualiseren - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+In deze les leer je hoe je een van de vele beschikbare Python-bibliotheken kunt gebruiken om interessante visualisaties te maken rondom het concept van hoeveelheden. Met behulp van een opgeschoonde dataset over de vogels van Minnesota kun je veel interessante feiten leren over de lokale fauna.
+## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/16)
+
+## Observeer vleugelspanwijdte met Matplotlib
+
+Een uitstekende bibliotheek om zowel eenvoudige als complexe grafieken en diagrammen van verschillende soorten te maken is [Matplotlib](https://matplotlib.org/stable/index.html). Over het algemeen omvat het proces van het plotten van gegevens met deze bibliotheken het identificeren van de delen van je dataframe die je wilt gebruiken, het uitvoeren van eventuele transformaties op die gegevens, het toewijzen van x- en y-aswaarden, het beslissen welk type plot je wilt tonen, en vervolgens het weergeven van de plot. Matplotlib biedt een grote verscheidenheid aan visualisaties, maar voor deze les richten we ons op de meest geschikte voor het visualiseren van hoeveelheden: lijndiagrammen, spreidingsdiagrammen en staafdiagrammen.
+
+> ✅ Gebruik het beste diagram dat past bij de structuur van je gegevens en het verhaal dat je wilt vertellen.
+> - Om trends in de tijd te analyseren: lijn
+> - Om waarden te vergelijken: staaf, kolom, taart, spreidingsdiagram
+> - Om te laten zien hoe delen zich verhouden tot een geheel: taart
+> - Om de verdeling van gegevens te tonen: spreidingsdiagram, staaf
+> - Om trends te tonen: lijn, kolom
+> - Om relaties tussen waarden te tonen: lijn, spreidingsdiagram, bubbel
+
+Als je een dataset hebt en wilt ontdekken hoeveel van een bepaald item erin zit, is een van de eerste taken die je moet uitvoeren het inspecteren van de waarden.
+
+✅ Er zijn zeer goede 'cheat sheets' beschikbaar voor Matplotlib [hier](https://matplotlib.org/cheatsheets/cheatsheets.pdf).
+
+## Maak een lijndiagram over vleugelspanwijdte van vogels
+
+Open het bestand `notebook.ipynb` in de hoofdmap van deze les en voeg een cel toe.
+
+> Opmerking: de gegevens zijn opgeslagen in de hoofdmap van deze repo in de map `/data`.
+
+```python
+import pandas as pd
+import matplotlib.pyplot as plt
+birds = pd.read_csv('../../data/birds.csv')
+birds.head()
+```
+Deze gegevens zijn een mix van tekst en cijfers:
+
+| | Naam | WetenschappelijkeNaam | Categorie | Orde | Familie | Geslacht | Beschermingsstatus | MinLengte | MaxLengte | MinLichaamsgewicht | MaxLichaamsgewicht | MinVleugelspan | MaxVleugelspan |
+| ---: | :---------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | -----------------: | -----------------: | -------------: | -------------: |
+| 0 | Zwartbuikfluiteend | Dendrocygna autumnalis | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
+| 1 | Bruinfluiteend | Dendrocygna bicolor | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
+| 2 | Sneeuwgans | Anser caerulescens | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
+| 3 | Ross' gans | Anser rossii | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
+| 4 | Grote rietgans | Anser albifrons | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
+
+Laten we beginnen met het plotten van enkele numerieke gegevens met een eenvoudig lijndiagram. Stel dat je een overzicht wilt van de maximale vleugelspanwijdte van deze interessante vogels.
+
+```python
+wingspan = birds['MaxWingspan']
+wingspan.plot()
+```
+
+
+Wat valt je meteen op? Er lijkt minstens één uitschieter te zijn - dat is een behoorlijke vleugelspanwijdte! Een vleugelspanwijdte van 2300 centimeter komt overeen met 23 meter - zijn er Pterodactylen in Minnesota? Laten we dit onderzoeken.
+
+Hoewel je snel in Excel kunt sorteren om die uitschieters te vinden, die waarschijnlijk typfouten zijn, kun je het visualisatieproces voortzetten door vanuit de plot te werken.
+
+Voeg labels toe aan de x-as om te laten zien om welke soorten vogels het gaat:
+
+```
+plt.title('Max Wingspan in Centimeters')
+plt.ylabel('Wingspan (CM)')
+plt.xlabel('Birds')
+plt.xticks(rotation=45)
+x = birds['Name']
+y = birds['MaxWingspan']
+
+plt.plot(x, y)
+
+plt.show()
+```
+
+
+Zelfs met de rotatie van de labels ingesteld op 45 graden, zijn er te veel om te lezen. Laten we een andere strategie proberen: label alleen die uitschieters en plaats de labels binnen de grafiek. Je kunt een spreidingsdiagram gebruiken om meer ruimte te maken voor de labeling:
+
+```python
+plt.title('Max Wingspan in Centimeters')
+plt.ylabel('Wingspan (CM)')
+plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
+
+for i in range(len(birds)):
+ x = birds['Name'][i]
+ y = birds['MaxWingspan'][i]
+ plt.plot(x, y, 'bo')
+ if birds['MaxWingspan'][i] > 500:
+ plt.text(x, y * (1 - 0.05), birds['Name'][i], fontsize=12)
+
+plt.show()
+```
+Wat gebeurt hier? Je hebt `tick_params` gebruikt om de onderste labels te verbergen en vervolgens een lus gemaakt over je vogel-dataset. Door de grafiek te plotten met kleine ronde blauwe stippen met behulp van `bo`, controleerde je op vogels met een maximale vleugelspanwijdte van meer dan 500 en toonde hun label naast de stip indien dat het geval was. Je verschoof de labels een beetje op de y-as (`y * (1 - 0.05)`) en gebruikte de vogelnaam als label.
+
+Wat heb je ontdekt?
+
+
+## Filter je gegevens
+
+Zowel de Amerikaanse zeearend als de Prairievalk, hoewel waarschijnlijk zeer grote vogels, lijken verkeerd gelabeld te zijn, met een extra `0` toegevoegd aan hun maximale vleugelspanwijdte. Het is onwaarschijnlijk dat je een Amerikaanse zeearend tegenkomt met een vleugelspanwijdte van 25 meter, maar als dat zo is, laat het ons dan weten! Laten we een nieuwe dataframe maken zonder die twee uitschieters:
+
+```python
+plt.title('Max Wingspan in Centimeters')
+plt.ylabel('Wingspan (CM)')
+plt.xlabel('Birds')
+plt.tick_params(axis='both',which='both',labelbottom=False,bottom=False)
+for i in range(len(birds)):
+ x = birds['Name'][i]
+ y = birds['MaxWingspan'][i]
+ if birds['Name'][i] not in ['Bald eagle', 'Prairie falcon']:
+ plt.plot(x, y, 'bo')
+plt.show()
+```
+
+Door uitschieters te filteren, zijn je gegevens nu meer samenhangend en begrijpelijk.
+
+
+
+Nu we een schonere dataset hebben, althans wat betreft vleugelspanwijdte, laten we meer ontdekken over deze vogels.
+
+Hoewel lijn- en spreidingsdiagrammen informatie kunnen tonen over gegevenswaarden en hun verdelingen, willen we nadenken over de waarden die inherent zijn aan deze dataset. Je zou visualisaties kunnen maken om de volgende vragen over hoeveelheden te beantwoorden:
+
+> Hoeveel categorieën vogels zijn er, en wat zijn hun aantallen?
+> Hoeveel vogels zijn uitgestorven, bedreigd, zeldzaam of algemeen?
+> Hoeveel zijn er van de verschillende geslachten en orden in de terminologie van Linnaeus?
+## Verken staafdiagrammen
+
+Staafdiagrammen zijn praktisch wanneer je groeperingen van gegevens wilt tonen. Laten we de categorieën vogels in deze dataset verkennen om te zien welke het meest voorkomt qua aantal.
+
+Maak in het notebook-bestand een eenvoudig staafdiagram.
+
+✅ Opmerking: je kunt de twee uitschietervogels die we in de vorige sectie hebben geïdentificeerd filteren, de typfout in hun vleugelspan corrigeren, of ze laten staan voor deze oefeningen die niet afhankelijk zijn van vleugelspanwaarden.
+
+Als je een staafdiagram wilt maken, kun je de gegevens selecteren waarop je je wilt richten. Staafdiagrammen kunnen worden gemaakt van ruwe gegevens:
+
+```python
+birds.plot(x='Category',
+ kind='bar',
+ stacked=True,
+ title='Birds of Minnesota')
+
+```
+
+
+Dit staafdiagram is echter onleesbaar omdat er te veel niet-gegroepeerde gegevens zijn. Je moet alleen de gegevens selecteren die je wilt plotten, dus laten we kijken naar de lengte van vogels op basis van hun categorie.
+
+Filter je gegevens om alleen de categorie van de vogel op te nemen.
+
+✅ Merk op dat je Pandas gebruikt om de gegevens te beheren en vervolgens Matplotlib om de grafiek te maken.
+
+Omdat er veel categorieën zijn, kun je deze grafiek verticaal weergeven en de hoogte aanpassen om rekening te houden met alle gegevens:
+
+```python
+category_count = birds.value_counts(birds['Category'].values, sort=True)
+plt.rcParams['figure.figsize'] = [6, 12]
+category_count.plot.barh()
+```
+
+
+Dit staafdiagram geeft een goed overzicht van het aantal vogels in elke categorie. In een oogopslag zie je dat het grootste aantal vogels in deze regio in de categorie Eenden/Ganzen/Watervogels valt. Minnesota is het 'land van 10.000 meren', dus dit is niet verrassend!
+
+✅ Probeer enkele andere tellingen op deze dataset. Verrast iets je?
+
+## Gegevens vergelijken
+
+Je kunt verschillende vergelijkingen van gegroepeerde gegevens proberen door nieuwe assen te maken. Probeer een vergelijking van de MaxLengte van een vogel, gebaseerd op zijn categorie:
+
+```python
+maxlength = birds['MaxLength']
+plt.barh(y=birds['Category'], width=maxlength)
+plt.rcParams['figure.figsize'] = [6, 12]
+plt.show()
+```
+
+
+Niets is hier verrassend: kolibries hebben de kleinste MaxLengte vergeleken met pelikanen of ganzen. Het is goed wanneer gegevens logisch zijn!
+
+Je kunt interessantere visualisaties van staafdiagrammen maken door gegevens te combineren. Laten we Minimum- en Maximumlengte combineren op een bepaalde vogelcategorie:
+
+```python
+minLength = birds['MinLength']
+maxLength = birds['MaxLength']
+category = birds['Category']
+
+plt.barh(category, maxLength)
+plt.barh(category, minLength)
+
+plt.show()
+```
+In deze grafiek kun je het bereik per vogelcategorie van de Minimumlengte en Maximumlengte zien. Je kunt veilig zeggen dat, gezien deze gegevens, hoe groter de vogel, hoe groter het lengterebereik. Fascinerend!
+
+
+
+## 🚀 Uitdaging
+
+Deze vogeldataset biedt een schat aan informatie over verschillende soorten vogels binnen een bepaald ecosysteem. Zoek op internet en kijk of je andere vogelgerichte datasets kunt vinden. Oefen met het maken van grafieken en diagrammen over deze vogels om feiten te ontdekken die je niet kende.
+## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/17)
+
+## Review & Zelfstudie
+
+Deze eerste les heeft je wat informatie gegeven over hoe je Matplotlib kunt gebruiken om hoeveelheden te visualiseren. Doe wat onderzoek naar andere manieren om met datasets te werken voor visualisatie. [Plotly](https://github.com/plotly/plotly.py) is een bibliotheek die we niet behandelen in deze lessen, dus kijk wat het te bieden heeft.
+## Opdracht
+
+[Lines, Scatters, and Bars](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/09-visualization-quantities/assignment.md b/translations/nl/3-Data-Visualization/09-visualization-quantities/assignment.md
new file mode 100644
index 00000000..4d60c816
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/09-visualization-quantities/assignment.md
@@ -0,0 +1,25 @@
+
+# Lijnen, Spreidingen en Staafdiagrammen
+
+## Instructies
+
+In deze les heb je gewerkt met lijndiagrammen, spreidingsdiagrammen en staafdiagrammen om interessante feiten over deze dataset te laten zien. In deze opdracht ga je dieper in op de dataset om een feit te ontdekken over een bepaald type vogel. Maak bijvoorbeeld een notebook waarin je alle interessante gegevens visualiseert die je kunt vinden over Sneeuwganzen. Gebruik de drie hierboven genoemde diagrammen om een verhaal te vertellen in je notebook.
+
+## Rubriek
+
+Uitmuntend | Voldoende | Verbetering Nodig
+--- | --- | --- |
+Een notebook wordt gepresenteerd met goede annotaties, een sterk verhaal en aantrekkelijke grafieken | Het notebook mist een van deze elementen | Het notebook mist twee van deze elementen
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/10-visualization-distributions/README.md b/translations/nl/3-Data-Visualization/10-visualization-distributions/README.md
new file mode 100644
index 00000000..efda70b5
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/10-visualization-distributions/README.md
@@ -0,0 +1,217 @@
+
+# Visualiseren van distributies
+
+| ](../../sketchnotes/10-Visualizing-Distributions.png)|
+|:---:|
+| Visualiseren van distributies - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+In de vorige les heb je enkele interessante feiten geleerd over een dataset over de vogels van Minnesota. Je hebt foutieve gegevens gevonden door uitschieters te visualiseren en hebt gekeken naar de verschillen tussen vogelcategorieën op basis van hun maximale lengte.
+
+## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18)
+## Verken de vogeldataset
+
+Een andere manier om gegevens te onderzoeken is door te kijken naar de distributie, of hoe de gegevens langs een as zijn georganiseerd. Misschien wil je bijvoorbeeld meer leren over de algemene distributie, voor deze dataset, van de maximale spanwijdte of maximale lichaamsmassa van de vogels van Minnesota.
+
+Laten we enkele feiten ontdekken over de distributies van gegevens in deze dataset. In het _notebook.ipynb_-bestand in de hoofdmap van deze les, importeer Pandas, Matplotlib en je gegevens:
+
+```python
+import pandas as pd
+import matplotlib.pyplot as plt
+birds = pd.read_csv('../../data/birds.csv')
+birds.head()
+```
+
+| | Naam | WetenschappelijkeNaam | Categorie | Orde | Familie | Geslacht | Beschermingsstatus | MinLengte | MaxLengte | MinLichaamsmassa | MaxLichaamsmassa | MinSpanwijdte | MaxSpanwijdte |
+| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | --------------: | --------------: | ------------: | ------------: |
+| 0 | Zwartbuikfluiteend | Dendrocygna autumnalis | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
+| 1 | Bruine fluiteend | Dendrocygna bicolor | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
+| 2 | Sneeuwgans | Anser caerulescens | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
+| 3 | Ross' gans | Anser rossii | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
+| 4 | Grote rietgans | Anser albifrons | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
+
+Over het algemeen kun je snel kijken naar hoe gegevens zijn verdeeld door een scatterplot te gebruiken, zoals we in de vorige les deden:
+
+```python
+birds.plot(kind='scatter',x='MaxLength',y='Order',figsize=(12,8))
+
+plt.title('Max Length per Order')
+plt.ylabel('Order')
+plt.xlabel('Max Length')
+
+plt.show()
+```
+
+
+Dit geeft een overzicht van de algemene verdeling van lichaamslengte per vogelorde, maar het is niet de optimale manier om echte distributies weer te geven. Die taak wordt meestal uitgevoerd door een histogram te maken.
+
+## Werken met histogrammen
+
+Matplotlib biedt zeer goede manieren om gegevensdistributie te visualiseren met behulp van histogrammen. Dit type grafiek lijkt op een staafdiagram waarbij de distributie kan worden gezien via een stijging en daling van de staven. Om een histogram te maken, heb je numerieke gegevens nodig. Om een histogram te maken, kun je een grafiek plotten waarbij je het type definieert als 'hist' voor histogram. Deze grafiek toont de distributie van MaxBodyMass voor het volledige bereik van numerieke gegevens in de dataset. Door de array van gegevens die het krijgt op te splitsen in kleinere bins, kan het de verdeling van de waarden van de gegevens weergeven:
+
+```python
+birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
+plt.show()
+```
+
+
+Zoals je kunt zien, valt het merendeel van de 400+ vogels in deze dataset in het bereik van minder dan 2000 voor hun maximale lichaamsmassa. Krijg meer inzicht in de gegevens door de `bins`-parameter te wijzigen naar een hoger aantal, bijvoorbeeld 30:
+
+```python
+birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
+plt.show()
+```
+
+
+Deze grafiek toont de distributie op een iets meer gedetailleerde manier. Een grafiek die minder naar links is scheefgetrokken, kan worden gemaakt door ervoor te zorgen dat je alleen gegevens binnen een bepaald bereik selecteert:
+
+Filter je gegevens om alleen die vogels te krijgen waarvan de lichaamsmassa onder de 60 ligt, en toon 40 `bins`:
+
+```python
+filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]
+filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
+plt.show()
+```
+
+
+✅ Probeer enkele andere filters en gegevenspunten. Om de volledige distributie van de gegevens te zien, verwijder je de `['MaxBodyMass']`-filter om gelabelde distributies weer te geven.
+
+Het histogram biedt ook enkele leuke kleur- en labelverbeteringen om te proberen:
+
+Maak een 2D-histogram om de relatie tussen twee distributies te vergelijken. Laten we `MaxBodyMass` vergelijken met `MaxLength`. Matplotlib biedt een ingebouwde manier om convergentie te tonen met behulp van helderdere kleuren:
+
+```python
+x = filteredBirds['MaxBodyMass']
+y = filteredBirds['MaxLength']
+
+fig, ax = plt.subplots(tight_layout=True)
+hist = ax.hist2d(x, y)
+```
+Er lijkt een verwachte correlatie te zijn tussen deze twee elementen langs een verwachte as, met één bijzonder sterk convergentiepunt:
+
+
+
+Histogrammen werken standaard goed voor numerieke gegevens. Wat als je distributies wilt zien op basis van tekstgegevens?
+## Verken de dataset voor distributies met tekstgegevens
+
+Deze dataset bevat ook goede informatie over de vogelcategorie en het geslacht, de soort en de familie, evenals de beschermingsstatus. Laten we deze beschermingsinformatie onderzoeken. Wat is de verdeling van de vogels volgens hun beschermingsstatus?
+
+> ✅ In de dataset worden verschillende acroniemen gebruikt om de beschermingsstatus te beschrijven. Deze acroniemen komen van de [IUCN Red List Categories](https://www.iucnredlist.org/), een organisatie die de status van soorten catalogiseert.
+>
+> - CR: Kritiek Bedreigd
+> - EN: Bedreigd
+> - EX: Uitgestorven
+> - LC: Minste Zorg
+> - NT: Bijna Bedreigd
+> - VU: Kwetsbaar
+
+Dit zijn tekstgebaseerde waarden, dus je moet een transformatie uitvoeren om een histogram te maken. Gebruik de filteredBirds dataframe om de beschermingsstatus weer te geven naast de minimale spanwijdte. Wat zie je?
+
+```python
+x1 = filteredBirds.loc[filteredBirds.ConservationStatus=='EX', 'MinWingspan']
+x2 = filteredBirds.loc[filteredBirds.ConservationStatus=='CR', 'MinWingspan']
+x3 = filteredBirds.loc[filteredBirds.ConservationStatus=='EN', 'MinWingspan']
+x4 = filteredBirds.loc[filteredBirds.ConservationStatus=='NT', 'MinWingspan']
+x5 = filteredBirds.loc[filteredBirds.ConservationStatus=='VU', 'MinWingspan']
+x6 = filteredBirds.loc[filteredBirds.ConservationStatus=='LC', 'MinWingspan']
+
+kwargs = dict(alpha=0.5, bins=20)
+
+plt.hist(x1, **kwargs, color='red', label='Extinct')
+plt.hist(x2, **kwargs, color='orange', label='Critically Endangered')
+plt.hist(x3, **kwargs, color='yellow', label='Endangered')
+plt.hist(x4, **kwargs, color='green', label='Near Threatened')
+plt.hist(x5, **kwargs, color='blue', label='Vulnerable')
+plt.hist(x6, **kwargs, color='gray', label='Least Concern')
+
+plt.gca().set(title='Conservation Status', ylabel='Min Wingspan')
+plt.legend();
+```
+
+
+
+Er lijkt geen goede correlatie te zijn tussen minimale spanwijdte en beschermingsstatus. Test andere elementen van de dataset met deze methode. Je kunt ook verschillende filters proberen. Vind je enige correlatie?
+
+## Dichtheidsplots
+
+Je hebt misschien gemerkt dat de histogrammen die we tot nu toe hebben bekeken 'getrapt' zijn en niet soepel in een boog verlopen. Om een vloeiender dichtheidsgrafiek te tonen, kun je een dichtheidsplot proberen.
+
+Om met dichtheidsplots te werken, kun je jezelf vertrouwd maken met een nieuwe plotbibliotheek, [Seaborn](https://seaborn.pydata.org/generated/seaborn.kdeplot.html).
+
+Laad Seaborn en probeer een basis dichtheidsplot:
+
+```python
+import seaborn as sns
+import matplotlib.pyplot as plt
+sns.kdeplot(filteredBirds['MinWingspan'])
+plt.show()
+```
+
+
+Je kunt zien hoe de plot de vorige grafiek voor minimale spanwijdtegegevens weerspiegelt; het is gewoon iets vloeiender. Volgens de documentatie van Seaborn: "In vergelijking met een histogram kan KDE een plot produceren die minder rommelig en beter interpreteerbaar is, vooral bij het tekenen van meerdere distributies. Maar het heeft de potentie om vervormingen te introduceren als de onderliggende distributie begrensd of niet vloeiend is. Net als een histogram hangt de kwaliteit van de representatie ook af van de selectie van goede gladmakingsparameters." [bron](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) Met andere woorden, uitschieters zullen zoals altijd je grafieken slecht laten functioneren.
+
+Als je die hoekige MaxBodyMass-lijn in de tweede grafiek die je hebt gemaakt opnieuw wilt bekijken, kun je deze heel goed gladstrijken door deze methode opnieuw te gebruiken:
+
+```python
+sns.kdeplot(filteredBirds['MaxBodyMass'])
+plt.show()
+```
+
+
+Als je een gladde, maar niet te gladde lijn wilt, bewerk je de `bw_adjust`-parameter:
+
+```python
+sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
+plt.show()
+```
+
+
+✅ Lees over de beschikbare parameters voor dit type plot en experimenteer!
+
+Dit type grafiek biedt prachtig verklarende visualisaties. Met een paar regels code kun je bijvoorbeeld de dichtheid van de maximale lichaamsmassa per vogelorde tonen:
+
+```python
+sns.kdeplot(
+ data=filteredBirds, x="MaxBodyMass", hue="Order",
+ fill=True, common_norm=False, palette="crest",
+ alpha=.5, linewidth=0,
+)
+```
+
+
+
+Je kunt ook de dichtheid van meerdere variabelen in één grafiek in kaart brengen. Test de MaxLength en MinLength van een vogel in vergelijking met hun beschermingsstatus:
+
+```python
+sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")
+```
+
+
+
+Misschien is het de moeite waard om te onderzoeken of de cluster van 'Kwetsbare' vogels volgens hun lengtes betekenisvol is of niet.
+
+## 🚀 Uitdaging
+
+Histogrammen zijn een meer geavanceerd type grafiek dan eenvoudige scatterplots, staafdiagrammen of lijndiagrammen. Ga op zoek op het internet naar goede voorbeelden van het gebruik van histogrammen. Hoe worden ze gebruikt, wat laten ze zien, en in welke vakgebieden of onderzoeksgebieden worden ze vaak gebruikt?
+
+## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/19)
+
+## Review & Zelfstudie
+
+In deze les heb je Matplotlib gebruikt en ben je begonnen met werken met Seaborn om meer geavanceerde grafieken te maken. Doe wat onderzoek naar `kdeplot` in Seaborn, een "continue waarschijnlijkheidsdichtheidscurve in één of meer dimensies". Lees de [documentatie](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) om te begrijpen hoe het werkt.
+
+## Opdracht
+
+[Pas je vaardigheden toe](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/10-visualization-distributions/assignment.md b/translations/nl/3-Data-Visualization/10-visualization-distributions/assignment.md
new file mode 100644
index 00000000..ea6adda9
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/10-visualization-distributions/assignment.md
@@ -0,0 +1,25 @@
+
+# Pas je vaardigheden toe
+
+## Instructies
+
+Tot nu toe heb je gewerkt met de Minnesota vogels dataset om informatie te ontdekken over vogelhoeveelheden en populatiedichtheid. Oefen het toepassen van deze technieken door een andere dataset te proberen, mogelijk afkomstig van [Kaggle](https://www.kaggle.com/). Bouw een notebook om een verhaal te vertellen over deze dataset en zorg ervoor dat je histogrammen gebruikt bij het bespreken ervan.
+
+## Rubriek
+
+Uitmuntend | Voldoende | Verbetering nodig
+--- | --- | -- |
+Een notebook wordt gepresenteerd met annotaties over deze dataset, inclusief de bron, en gebruikt minstens 5 histogrammen om feiten over de data te ontdekken. | Een notebook wordt gepresenteerd met incomplete annotaties of fouten. | Een notebook wordt gepresenteerd zonder annotaties en bevat fouten.
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we ons best doen om nauwkeurigheid te garanderen, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/11-visualization-proportions/README.md b/translations/nl/3-Data-Visualization/11-visualization-proportions/README.md
new file mode 100644
index 00000000..6cc00b07
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/11-visualization-proportions/README.md
@@ -0,0 +1,204 @@
+
+# Visualiseren van Verhoudingen
+
+| ](../../sketchnotes/11-Visualizing-Proportions.png)|
+|:---:|
+|Visualiseren van Verhoudingen - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+In deze les gebruik je een dataset met een focus op de natuur om verhoudingen te visualiseren, zoals hoeveel verschillende soorten paddenstoelen voorkomen in een gegeven dataset over champignons. Laten we deze fascinerende schimmels verkennen met behulp van een dataset van Audubon, die details bevat over 23 soorten plaatjeszwammen in de Agaricus- en Lepiota-families. Je gaat experimenteren met smakelijke visualisaties zoals:
+
+- Taartdiagrammen 🥧
+- Donutdiagrammen 🍩
+- Waffeldiagrammen 🧇
+
+> 💡 Een heel interessant project genaamd [Charticulator](https://charticulator.com) van Microsoft Research biedt een gratis drag-and-drop-interface voor datavisualisaties. In een van hun tutorials gebruiken ze ook deze champignondataset! Zo kun je de data verkennen en tegelijkertijd de bibliotheek leren kennen: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html).
+
+## [Quiz voorafgaand aan de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20)
+
+## Leer je champignons kennen 🍄
+
+Paddenstoelen zijn erg interessant. Laten we een dataset importeren om ze te bestuderen:
+
+```python
+import pandas as pd
+import matplotlib.pyplot as plt
+mushrooms = pd.read_csv('../../data/mushrooms.csv')
+mushrooms.head()
+```
+Een tabel wordt weergegeven met geweldige gegevens voor analyse:
+
+| class | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | stalk-root | stalk-surface-above-ring | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
+| --------- | --------- | ----------- | --------- | ------- | ------- | --------------- | ------------ | --------- | ---------- | ----------- | ---------- | ------------------------ | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
+| Giftig | Convex | Smooth | Brown | Bruises | Pungent | Free | Close | Narrow | Black | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
+| Eetbaar | Convex | Smooth | Yellow | Bruises | Almond | Free | Close | Broad | Black | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Grasses |
+| Eetbaar | Bell | Smooth | White | Bruises | Anise | Free | Close | Broad | Brown | Enlarging | Club | Smooth | Smooth | White | White | Partial | White | One | Pendant | Brown | Numerous | Meadows |
+| Giftig | Convex | Scaly | White | Bruises | Pungent | Free | Close | Narrow | Brown | Enlarging | Equal | Smooth | Smooth | White | White | Partial | White | One | Pendant | Black | Scattered | Urban |
+
+Je merkt meteen dat alle gegevens tekstueel zijn. Je zult deze gegevens moeten omzetten om ze in een diagram te kunnen gebruiken. De meeste gegevens worden zelfs weergegeven als een object:
+
+```python
+print(mushrooms.select_dtypes(["object"]).columns)
+```
+
+De uitvoer is:
+
+```output
+Index(['class', 'cap-shape', 'cap-surface', 'cap-color', 'bruises', 'odor',
+ 'gill-attachment', 'gill-spacing', 'gill-size', 'gill-color',
+ 'stalk-shape', 'stalk-root', 'stalk-surface-above-ring',
+ 'stalk-surface-below-ring', 'stalk-color-above-ring',
+ 'stalk-color-below-ring', 'veil-type', 'veil-color', 'ring-number',
+ 'ring-type', 'spore-print-color', 'population', 'habitat'],
+ dtype='object')
+```
+Neem deze gegevens en converteer de 'class'-kolom naar een categorie:
+
+```python
+cols = mushrooms.select_dtypes(["object"]).columns
+mushrooms[cols] = mushrooms[cols].astype('category')
+```
+
+```python
+edibleclass=mushrooms.groupby(['class']).count()
+edibleclass
+```
+
+Als je nu de champignongegevens afdrukt, zie je dat ze zijn gegroepeerd in categorieën op basis van de giftige/eetbare klasse:
+
+| | cap-shape | cap-surface | cap-color | bruises | odor | gill-attachment | gill-spacing | gill-size | gill-color | stalk-shape | ... | stalk-surface-below-ring | stalk-color-above-ring | stalk-color-below-ring | veil-type | veil-color | ring-number | ring-type | spore-print-color | population | habitat |
+| --------- | --------- | ----------- | --------- | ------- | ---- | --------------- | ------------ | --------- | ---------- | ----------- | --- | ------------------------ | ---------------------- | ---------------------- | --------- | ---------- | ----------- | --------- | ----------------- | ---------- | ------- |
+| class | | | | | | | | | | | | | | | | | | | | | |
+| Eetbaar | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | ... | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 | 4208 |
+| Giftig | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | ... | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 | 3916 |
+
+Als je de volgorde in deze tabel aanhoudt om je klassenlabels te maken, kun je een taartdiagram maken:
+
+## Taart!
+
+```python
+labels=['Edible','Poisonous']
+plt.pie(edibleclass['population'],labels=labels,autopct='%.1f %%')
+plt.title('Edible?')
+plt.show()
+```
+Voila, een taartdiagram dat de verhoudingen van deze gegevens laat zien volgens deze twee klassen van champignons. Het is erg belangrijk om de volgorde van de labels correct te krijgen, vooral hier, dus controleer de volgorde waarmee de labelarray is opgebouwd!
+
+
+
+## Donuts!
+
+Een iets visueel interessanter taartdiagram is een donutdiagram, wat een taartdiagram is met een gat in het midden. Laten we onze gegevens op deze manier bekijken.
+
+Bekijk de verschillende habitats waar champignons groeien:
+
+```python
+habitat=mushrooms.groupby(['habitat']).count()
+habitat
+```
+Hier groepeer je je gegevens op habitat. Er zijn er 7 vermeld, dus gebruik die als labels voor je donutdiagram:
+
+```python
+labels=['Grasses','Leaves','Meadows','Paths','Urban','Waste','Wood']
+
+plt.pie(habitat['class'], labels=labels,
+ autopct='%1.1f%%', pctdistance=0.85)
+
+center_circle = plt.Circle((0, 0), 0.40, fc='white')
+fig = plt.gcf()
+
+fig.gca().add_artist(center_circle)
+
+plt.title('Mushroom Habitats')
+
+plt.show()
+```
+
+
+
+Deze code tekent een diagram en een cirkel in het midden, en voegt die cirkel toe aan het diagram. Pas de breedte van de cirkel aan door `0.40` te wijzigen in een andere waarde.
+
+Donutdiagrammen kunnen op verschillende manieren worden aangepast om de labels te wijzigen. De labels kunnen bijvoorbeeld worden benadrukt voor betere leesbaarheid. Lees meer in de [documentatie](https://matplotlib.org/stable/gallery/pie_and_polar_charts/pie_and_donut_labels.html?highlight=donut).
+
+Nu je weet hoe je je gegevens kunt groeperen en weergeven als een taart- of donutdiagram, kun je andere soorten diagrammen verkennen. Probeer een waffeldiagram, wat gewoon een andere manier is om hoeveelheden te verkennen.
+
+## Wafels!
+
+Een 'waffel'-type diagram is een andere manier om hoeveelheden te visualiseren als een 2D-array van vierkanten. Probeer de verschillende hoeveelheden hoedkleuren van champignons in deze dataset te visualiseren. Hiervoor moet je een hulpbibliotheek genaamd [PyWaffle](https://pypi.org/project/pywaffle/) installeren en Matplotlib gebruiken:
+
+```python
+pip install pywaffle
+```
+
+Selecteer een segment van je gegevens om te groeperen:
+
+```python
+capcolor=mushrooms.groupby(['cap-color']).count()
+capcolor
+```
+
+Maak een waffeldiagram door labels te maken en vervolgens je gegevens te groeperen:
+
+```python
+import pandas as pd
+import matplotlib.pyplot as plt
+from pywaffle import Waffle
+
+data ={'color': ['brown', 'buff', 'cinnamon', 'green', 'pink', 'purple', 'red', 'white', 'yellow'],
+ 'amount': capcolor['class']
+ }
+
+df = pd.DataFrame(data)
+
+fig = plt.figure(
+ FigureClass = Waffle,
+ rows = 100,
+ values = df.amount,
+ labels = list(df.color),
+ figsize = (30,30),
+ colors=["brown", "tan", "maroon", "green", "pink", "purple", "red", "whitesmoke", "yellow"],
+)
+```
+
+Met een waffeldiagram kun je duidelijk de verhoudingen van hoedkleuren in deze champignondataset zien. Interessant genoeg zijn er veel champignons met groene hoeden!
+
+
+
+✅ PyWaffle ondersteunt iconen binnen de diagrammen die elk pictogram gebruiken dat beschikbaar is in [Font Awesome](https://fontawesome.com/). Experimenteer om een nog interessanter waffeldiagram te maken met iconen in plaats van vierkanten.
+
+In deze les heb je drie manieren geleerd om verhoudingen te visualiseren. Eerst moet je je gegevens groeperen in categorieën en vervolgens beslissen wat de beste manier is om de gegevens weer te geven - taart, donut of wafel. Allemaal zijn ze heerlijk en geven de gebruiker direct een overzicht van een dataset.
+
+## 🚀 Uitdaging
+
+Probeer deze smakelijke diagrammen opnieuw te maken in [Charticulator](https://charticulator.com).
+## [Quiz na de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21)
+
+## Herziening & Zelfstudie
+
+Soms is het niet duidelijk wanneer je een taart-, donut- of waffeldiagram moet gebruiken. Hier zijn enkele artikelen om te lezen over dit onderwerp:
+
+https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
+
+https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
+
+https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
+
+https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
+
+Doe wat onderzoek om meer informatie te vinden over deze lastige keuze.
+
+## Opdracht
+
+[Probeer het in Excel](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/11-visualization-proportions/assignment.md b/translations/nl/3-Data-Visualization/11-visualization-proportions/assignment.md
new file mode 100644
index 00000000..ed7d6628
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/11-visualization-proportions/assignment.md
@@ -0,0 +1,25 @@
+
+# Probeer het in Excel
+
+## Instructies
+
+Wist je dat je in Excel donut-, taart- en wafelgrafieken kunt maken? Gebruik een dataset naar keuze om deze drie grafieken direct in een Excel-spreadsheet te maken.
+
+## Beoordelingscriteria
+
+| Uitmuntend | Voldoende | Moet Verbeteren |
+| ------------------------------------------------------- | ------------------------------------------------ | ----------------------------------------------------- |
+| Een Excel-spreadsheet wordt gepresenteerd met alle drie de grafieken | Een Excel-spreadsheet wordt gepresenteerd met twee grafieken | Een Excel-spreadsheet wordt gepresenteerd met slechts één grafiek |
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we ons best doen om nauwkeurigheid te garanderen, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/12-visualization-relationships/README.md b/translations/nl/3-Data-Visualization/12-visualization-relationships/README.md
new file mode 100644
index 00000000..5874ec51
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/12-visualization-relationships/README.md
@@ -0,0 +1,186 @@
+
+# Relaties visualiseren: Alles over honing 🍯
+
+| ](../../sketchnotes/12-Visualizing-Relationships.png)|
+|:---:|
+|Relaties visualiseren - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+In lijn met de natuurfocus van ons onderzoek, laten we interessante visualisaties ontdekken om de relaties tussen verschillende soorten honing te tonen, gebaseerd op een dataset afkomstig van het [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
+
+Deze dataset van ongeveer 600 items toont de honingproductie in veel Amerikaanse staten. Je kunt bijvoorbeeld kijken naar het aantal kolonies, opbrengst per kolonie, totale productie, voorraden, prijs per pond en de waarde van de geproduceerde honing in een bepaalde staat van 1998-2012, met één rij per jaar voor elke staat.
+
+Het is interessant om de relatie te visualiseren tussen de productie van een bepaalde staat per jaar en bijvoorbeeld de prijs van honing in die staat. Alternatief kun je de relatie visualiseren tussen de opbrengst per kolonie in verschillende staten. Deze periode omvat de verwoestende 'CCD' of 'Colony Collapse Disorder', die voor het eerst werd waargenomen in 2006 (http://npic.orst.edu/envir/ccd.html), waardoor het een aangrijpende dataset is om te bestuderen. 🐝
+
+## [Quiz voorafgaand aan de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/22)
+
+In deze les kun je Seaborn gebruiken, een bibliotheek die je al eerder hebt gebruikt, om relaties tussen variabelen te visualiseren. Vooral interessant is het gebruik van de `relplot`-functie van Seaborn, waarmee scatterplots en lijnplots snel '[statistische relaties](https://seaborn.pydata.org/tutorial/relational.html?highlight=relationships)' kunnen visualiseren. Dit stelt de datawetenschapper in staat om beter te begrijpen hoe variabelen zich tot elkaar verhouden.
+
+## Scatterplots
+
+Gebruik een scatterplot om te laten zien hoe de prijs van honing zich jaar na jaar per staat heeft ontwikkeld. Seaborn, met behulp van `relplot`, groepeert handig de gegevens per staat en toont datapunten voor zowel categorische als numerieke gegevens.
+
+Laten we beginnen met het importeren van de gegevens en Seaborn:
+
+```python
+import pandas as pd
+import matplotlib.pyplot as plt
+import seaborn as sns
+honey = pd.read_csv('../../data/honey.csv')
+honey.head()
+```
+Je merkt dat de honingdata verschillende interessante kolommen bevat, waaronder jaar en prijs per pond. Laten we deze gegevens verkennen, gegroepeerd per Amerikaanse staat:
+
+| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | jaar |
+| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
+| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
+| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
+| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
+| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
+| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
+
+Maak een eenvoudige scatterplot om de relatie te tonen tussen de prijs per pond honing en de staat van herkomst. Maak de `y`-as hoog genoeg om alle staten weer te geven:
+
+```python
+sns.relplot(x="priceperlb", y="state", data=honey, height=15, aspect=.5);
+```
+
+
+Toon nu dezelfde gegevens met een honingkleurenschema om te laten zien hoe de prijs zich door de jaren heen ontwikkelt. Je kunt dit doen door een 'hue'-parameter toe te voegen om de verandering jaar na jaar te tonen:
+
+> ✅ Lees meer over de [kleurenpaletten die je kunt gebruiken in Seaborn](https://seaborn.pydata.org/tutorial/color_palettes.html) - probeer een prachtig regenboogkleurenschema!
+
+```python
+sns.relplot(x="priceperlb", y="state", hue="year", palette="YlOrBr", data=honey, height=15, aspect=.5);
+```
+
+
+Met deze kleurenschemawijziging kun je duidelijk zien dat er een sterke progressie is in de prijs per pond honing door de jaren heen. Als je een steekproef uit de gegevens neemt om dit te verifiëren (kies bijvoorbeeld een bepaalde staat, Arizona), kun je een patroon van prijsstijgingen jaar na jaar zien, met enkele uitzonderingen:
+
+| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | jaar |
+| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
+| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
+| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
+| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
+| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
+| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
+| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
+| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
+| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
+| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
+| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
+| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
+| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
+| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
+| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
+| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
+
+Een andere manier om deze progressie te visualiseren is door grootte te gebruiken in plaats van kleur. Voor kleurenblinde gebruikers kan dit een betere optie zijn. Bewerk je visualisatie om een prijsstijging te tonen door een toename in de omtrek van de stippen:
+
+```python
+sns.relplot(x="priceperlb", y="state", size="year", data=honey, height=15, aspect=.5);
+```
+Je kunt zien dat de grootte van de stippen geleidelijk toeneemt.
+
+
+
+Is dit een eenvoudig geval van vraag en aanbod? Door factoren zoals klimaatverandering en kolonie-instorting is er misschien minder honing beschikbaar voor aankoop jaar na jaar, en stijgt daardoor de prijs?
+
+Om een correlatie tussen enkele variabelen in deze dataset te ontdekken, laten we enkele lijngrafieken verkennen.
+
+## Lijngrafieken
+
+Vraag: Is er een duidelijke stijging in de prijs van honing per pond jaar na jaar? Je kunt dit het gemakkelijkst ontdekken door een enkele lijngrafiek te maken:
+
+```python
+sns.relplot(x="year", y="priceperlb", kind="line", data=honey);
+```
+Antwoord: Ja, met enkele uitzonderingen rond het jaar 2003:
+
+
+
+✅ Omdat Seaborn gegevens rond één lijn aggregeert, toont het "de meerdere metingen bij elke x-waarde door het gemiddelde en het 95% betrouwbaarheidsinterval rond het gemiddelde te plotten". [Bron](https://seaborn.pydata.org/tutorial/relational.html). Dit tijdrovende gedrag kan worden uitgeschakeld door `ci=None` toe te voegen.
+
+Vraag: Kunnen we in 2003 ook een piek zien in de honingvoorraad? Wat als je kijkt naar de totale productie jaar na jaar?
+
+```python
+sns.relplot(x="year", y="totalprod", kind="line", data=honey);
+```
+
+
+
+Antwoord: Niet echt. Als je kijkt naar de totale productie, lijkt deze in dat specifieke jaar zelfs te zijn toegenomen, hoewel de hoeveelheid geproduceerde honing over het algemeen in deze jaren afneemt.
+
+Vraag: Wat zou dan die piek in de honingprijs rond 2003 kunnen hebben veroorzaakt?
+
+Om dit te ontdekken, kun je een facet grid verkennen.
+
+## Facet grids
+
+Facet grids nemen één facet van je dataset (in ons geval kun je 'jaar' kiezen om te voorkomen dat er te veel facetten worden geproduceerd). Seaborn kan vervolgens een plot maken voor elk van die facetten van je gekozen x- en y-coördinaten voor een gemakkelijkere visuele vergelijking. Valt 2003 op in dit soort vergelijking?
+
+Maak een facet grid door `relplot` te blijven gebruiken zoals aanbevolen door [Seaborn's documentatie](https://seaborn.pydata.org/generated/seaborn.FacetGrid.html?highlight=facetgrid#seaborn.FacetGrid).
+
+```python
+sns.relplot(
+ data=honey,
+ x="yieldpercol", y="numcol",
+ col="year",
+ col_wrap=3,
+ kind="line"
+```
+In deze visualisatie kun je de opbrengst per kolonie en het aantal kolonies jaar na jaar vergelijken, naast elkaar met een wrap ingesteld op 3 voor de kolommen:
+
+
+
+Voor deze dataset valt er niets bijzonders op met betrekking tot het aantal kolonies en hun opbrengst, jaar na jaar en staat na staat. Is er een andere manier om een correlatie tussen deze twee variabelen te vinden?
+
+## Dubbele-lijnplots
+
+Probeer een meerlijnige plot door twee lijnplots bovenop elkaar te leggen, gebruikmakend van Seaborn's 'despine' om de bovenste en rechter spines te verwijderen, en gebruik `ax.twinx` [afgeleid van Matplotlib](https://matplotlib.org/stable/api/_as_gen/matplotlib.axes.Axes.twinx.html). Twinx maakt het mogelijk om een grafiek de x-as te laten delen en twee y-assen weer te geven. Toon dus de opbrengst per kolonie en het aantal kolonies, bovenop elkaar gelegd:
+
+```python
+fig, ax = plt.subplots(figsize=(12,6))
+lineplot = sns.lineplot(x=honey['year'], y=honey['numcol'], data=honey,
+ label = 'Number of bee colonies', legend=False)
+sns.despine()
+plt.ylabel('# colonies')
+plt.title('Honey Production Year over Year');
+
+ax2 = ax.twinx()
+lineplot2 = sns.lineplot(x=honey['year'], y=honey['yieldpercol'], ax=ax2, color="r",
+ label ='Yield per colony', legend=False)
+sns.despine(right=False)
+plt.ylabel('colony yield')
+ax.figure.legend();
+```
+
+
+Hoewel er rond het jaar 2003 niets opvallends te zien is, eindigen we deze les op een wat vrolijkere noot: hoewel het aantal kolonies over het algemeen afneemt, stabiliseert het aantal kolonies zelfs als hun opbrengst per kolonie afneemt.
+
+Go, bijen, go!
+
+🐝❤️
+## 🚀 Uitdaging
+
+In deze les heb je meer geleerd over andere toepassingen van scatterplots en lijnroosters, waaronder facet grids. Daag jezelf uit om een facet grid te maken met een andere dataset, misschien een die je eerder in deze lessen hebt gebruikt. Let op hoe lang het duurt om ze te maken en hoe je voorzichtig moet zijn met hoeveel grids je moet tekenen met deze technieken.
+## [Quiz na de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/23)
+
+## Review & Zelfstudie
+
+Lijnplots kunnen eenvoudig of behoorlijk complex zijn. Lees wat meer in de [Seaborn-documentatie](https://seaborn.pydata.org/generated/seaborn.lineplot.html) over de verschillende manieren waarop je ze kunt bouwen. Probeer de lijnplots die je in deze les hebt gemaakt te verbeteren met andere methoden die in de documentatie worden vermeld.
+## Opdracht
+
+[Duik in de bijenkorf](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/12-visualization-relationships/assignment.md b/translations/nl/3-Data-Visualization/12-visualization-relationships/assignment.md
new file mode 100644
index 00000000..354a38ba
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/12-visualization-relationships/assignment.md
@@ -0,0 +1,25 @@
+
+# Duik in de bijenkorf
+
+## Instructies
+
+In deze les ben je begonnen met het bekijken van een dataset over bijen en hun honingproductie gedurende een periode waarin de bijenkolonies als geheel een afname in populatie zagen. Verdiep je verder in deze dataset en bouw een notebook dat het verhaal vertelt over de gezondheid van de bijenpopulatie, per staat en per jaar. Ontdek je iets interessants in deze dataset?
+
+## Rubriek
+
+| Uitmuntend | Voldoende | Verbetering nodig |
+| ------------------------------------------------------------------------------------------------------------------------------------------------------- | ---------------------------------------- | ---------------------------------------- |
+| Een notebook wordt gepresenteerd met een verhaal, voorzien van ten minste drie verschillende grafieken die aspecten van de dataset tonen, per staat en per jaar | Het notebook mist een van deze elementen | Het notebook mist twee van deze elementen |
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/13-meaningful-visualizations/README.md b/translations/nl/3-Data-Visualization/13-meaningful-visualizations/README.md
new file mode 100644
index 00000000..f625e39d
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/13-meaningful-visualizations/README.md
@@ -0,0 +1,182 @@
+
+# Betekenisvolle Visualisaties Maken
+
+| ](../../sketchnotes/13-MeaningfulViz.png)|
+|:---:|
+| Betekenisvolle Visualisaties - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+> "Als je de data lang genoeg martelt, zal het alles bekennen" -- [Ronald Coase](https://en.wikiquote.org/wiki/Ronald_Coase)
+
+Een van de basisvaardigheden van een datawetenschapper is het vermogen om een betekenisvolle datavisualisatie te maken die helpt vragen te beantwoorden. Voordat je je data visualiseert, moet je ervoor zorgen dat deze is opgeschoond en voorbereid, zoals je in eerdere lessen hebt gedaan. Daarna kun je beginnen met beslissen hoe je de data het beste kunt presenteren.
+
+In deze les ga je het volgende bekijken:
+
+1. Hoe kies je het juiste type grafiek
+2. Hoe vermijd je misleidende grafieken
+3. Hoe werk je met kleur
+4. Hoe style je grafieken voor leesbaarheid
+5. Hoe bouw je geanimeerde of 3D-grafieken
+6. Hoe maak je een creatieve visualisatie
+
+## [Pre-Les Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/24)
+
+## Kies het juiste type grafiek
+
+In eerdere lessen heb je geëxperimenteerd met het maken van allerlei interessante datavisualisaties met Matplotlib en Seaborn. Over het algemeen kun je het [juiste type grafiek](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) kiezen voor de vraag die je stelt met behulp van deze tabel:
+
+| Je wilt: | Gebruik: |
+| -------------------------- | ------------------------------- |
+| Trends in data over tijd tonen | Lijn |
+| Categorieën vergelijken | Staaf, Taart |
+| Totalen vergelijken | Taart, Gestapelde Staaf |
+| Relaties tonen | Spreiding, Lijn, Facet, Dubbele Lijn |
+| Distributies tonen | Spreiding, Histogram, Box |
+| Verhoudingen tonen | Taart, Donut, Wafel |
+
+> ✅ Afhankelijk van de samenstelling van je data moet je deze mogelijk omzetten van tekst naar numeriek om een bepaalde grafiek te ondersteunen.
+
+## Vermijd misleiding
+
+Zelfs als een datawetenschapper zorgvuldig het juiste type grafiek kiest voor de juiste data, zijn er genoeg manieren waarop data kan worden weergegeven om een punt te bewijzen, vaak ten koste van de integriteit van de data. Er zijn veel voorbeelden van misleidende grafieken en infographics!
+
+[](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
+
+> 🎥 Klik op de afbeelding hierboven voor een conferentietoespraak over misleidende grafieken
+
+Deze grafiek keert de X-as om om het tegenovergestelde van de waarheid te tonen, gebaseerd op datum:
+
+
+
+[Deze grafiek](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) is nog misleidender, omdat het oog naar rechts wordt getrokken om te concluderen dat COVID-gevallen in de verschillende provincies in de loop van de tijd zijn afgenomen. Als je echter goed naar de datums kijkt, zie je dat ze zijn herschikt om die misleidende dalende trend te geven.
+
+
+
+Dit beruchte voorbeeld gebruikt kleur EN een omgekeerde Y-as om te misleiden: in plaats van te concluderen dat het aantal schietincidenten steeg na de invoering van gun-vriendelijke wetgeving, wordt het oog misleid om te denken dat het tegenovergestelde waar is:
+
+
+
+Deze vreemde grafiek laat zien hoe proporties kunnen worden gemanipuleerd, met hilarisch effect:
+
+
+
+Het vergelijken van het onvergelijkbare is nog een schimmige truc. Er is een [geweldige website](https://tylervigen.com/spurious-correlations) helemaal gewijd aan 'spurious correlations' die 'feiten' tonen zoals de correlatie tussen het echtscheidingspercentage in Maine en de consumptie van margarine. Een Reddit-groep verzamelt ook de [lelijke toepassingen](https://www.reddit.com/r/dataisugly/top/?t=all) van data.
+
+Het is belangrijk te begrijpen hoe gemakkelijk het oog kan worden misleid door misleidende grafieken. Zelfs als de intentie van de datawetenschapper goed is, kan de keuze voor een slecht type grafiek, zoals een taartdiagram met te veel categorieën, misleidend zijn.
+
+## Kleur
+
+Je zag in de 'Florida gun violence'-grafiek hierboven hoe kleur een extra laag betekenis kan toevoegen aan grafieken, vooral grafieken die niet zijn ontworpen met bibliotheken zoals Matplotlib en Seaborn, die verschillende goedgekeurde kleurenschema's en paletten bevatten. Als je een grafiek met de hand maakt, doe dan een beetje onderzoek naar [kleurentheorie](https://colormatters.com/color-and-design/basic-color-theory).
+
+> ✅ Houd er rekening mee dat toegankelijkheid een belangrijk aspect is van visualisatie. Sommige gebruikers kunnen kleurenblind zijn - wordt je grafiek goed weergegeven voor gebruikers met visuele beperkingen?
+
+Wees voorzichtig bij het kiezen van kleuren voor je grafiek, omdat kleur een betekenis kan overbrengen die je misschien niet bedoelt. De 'pink ladies' in de 'hoogte'-grafiek hierboven geven een duidelijk 'vrouwelijke' toegewezen betekenis die bijdraagt aan de eigenaardigheid van de grafiek zelf.
+
+Hoewel [kleurbetekenis](https://colormatters.com/color-symbolism/the-meanings-of-colors) kan verschillen in verschillende delen van de wereld en de betekenis kan veranderen afhankelijk van de tint, omvatten algemene kleurbetekenissen:
+
+| Kleur | Betekenis |
+| ------ | ------------------- |
+| rood | kracht |
+| blauw | vertrouwen, loyaliteit |
+| geel | geluk, voorzichtigheid |
+| groen | ecologie, geluk, jaloezie |
+| paars | geluk |
+| oranje | levendigheid |
+
+Als je de taak hebt om een grafiek te maken met aangepaste kleuren, zorg er dan voor dat je grafieken zowel toegankelijk zijn als dat de kleur die je kiest overeenkomt met de betekenis die je probeert over te brengen.
+
+## Grafieken stylen voor leesbaarheid
+
+Grafieken zijn niet betekenisvol als ze niet leesbaar zijn! Neem de tijd om de breedte en hoogte van je grafiek te stylen zodat deze goed schaalt met je data. Als één variabele (zoals alle 50 staten) moet worden weergegeven, toon ze dan verticaal op de Y-as indien mogelijk om een horizontaal scrollende grafiek te vermijden.
+
+Label je assen, geef indien nodig een legenda en bied tooltips voor een betere begrip van de data.
+
+Als je data tekstueel en uitgebreid is op de X-as, kun je de tekst schuin zetten voor een betere leesbaarheid. [Matplotlib](https://matplotlib.org/stable/tutorials/toolkits/mplot3d.html) biedt 3D-plotten, als je data dit ondersteunt. Geavanceerde datavisualisaties kunnen worden geproduceerd met `mpl_toolkits.mplot3d`.
+
+
+
+## Animatie en 3D-grafiekweergave
+
+Sommige van de beste datavisualisaties vandaag de dag zijn geanimeerd. Shirley Wu heeft geweldige voorbeelden gemaakt met D3, zoals '[film flowers](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', waarbij elke bloem een visualisatie van een film is. Een ander voorbeeld voor de Guardian is 'bussed out', een interactieve ervaring die visualisaties combineert met Greensock en D3 plus een scrollytelling artikelvorm om te laten zien hoe NYC omgaat met het daklozenprobleem door mensen uit de stad te sturen.
+
+
+
+> "Bussed Out: How America Moves its Homeless" van [the Guardian](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). Visualisaties door Nadieh Bremer & Shirley Wu
+
+Hoewel deze les onvoldoende diepgang biedt om deze krachtige visualisatiebibliotheken te leren, kun je proberen D3 te gebruiken in een Vue.js-app met een bibliotheek om een visualisatie van het boek "Dangerous Liaisons" als een geanimeerd sociaal netwerk weer te geven.
+
+> "Les Liaisons Dangereuses" is een briefroman, of een roman gepresenteerd als een reeks brieven. Geschreven in 1782 door Choderlos de Laclos, vertelt het het verhaal van de wrede, moreel-bankroete sociale manoeuvres van twee strijdende protagonisten van de Franse aristocratie in de late 18e eeuw, de Vicomte de Valmont en de Marquise de Merteuil. Beide komen uiteindelijk aan hun einde, maar niet zonder veel sociale schade aan te richten. De roman ontvouwt zich als een reeks brieven geschreven aan verschillende mensen in hun kringen, met plannen voor wraak of simpelweg om problemen te veroorzaken. Maak een visualisatie van deze brieven om de belangrijkste spelers in het verhaal visueel te ontdekken.
+
+Je zult een webapp voltooien die een geanimeerde weergave van dit sociale netwerk toont. Het gebruikt een bibliotheek die is gebouwd om een [visualisatie van een netwerk](https://github.com/emiliorizzo/vue-d3-network) te maken met Vue.js en D3. Wanneer de app draait, kun je de knooppunten op het scherm verplaatsen om de data te herschikken.
+
+
+
+## Project: Bouw een grafiek om een netwerk te tonen met D3.js
+
+> Deze lesmap bevat een `solution`-map waar je het voltooide project kunt vinden ter referentie.
+
+1. Volg de instructies in het README.md-bestand in de root van de startermap. Zorg ervoor dat je NPM en Node.js op je machine hebt draaien voordat je de afhankelijkheden van je project installeert.
+
+2. Open de `starter/src`-map. Je vindt een `assets`-map met een .json-bestand met alle brieven uit de roman, genummerd, met een 'to' en 'from'-annotatie.
+
+3. Voltooi de code in `components/Nodes.vue` om de visualisatie mogelijk te maken. Zoek naar de methode genaamd `createLinks()` en voeg de volgende geneste lus toe.
+
+Loop door het .json-object om de 'to' en 'from'-data voor de brieven vast te leggen en bouw het `links`-object op zodat de visualisatiebibliotheek het kan gebruiken:
+
+```javascript
+//loop through letters
+ let f = 0;
+ let t = 0;
+ for (var i = 0; i < letters.length; i++) {
+ for (var j = 0; j < characters.length; j++) {
+
+ if (characters[j] == letters[i].from) {
+ f = j;
+ }
+ if (characters[j] == letters[i].to) {
+ t = j;
+ }
+ }
+ this.links.push({ sid: f, tid: t });
+ }
+ ```
+
+Voer je app uit vanuit de terminal (npm run serve) en geniet van de visualisatie!
+
+## 🚀 Uitdaging
+
+Maak een rondje op het internet om misleidende visualisaties te ontdekken. Hoe misleidt de auteur de gebruiker, en is dit opzettelijk? Probeer de visualisaties te corrigeren om te laten zien hoe ze eruit zouden moeten zien.
+
+## [Post-Les Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/25)
+
+## Review & Zelfstudie
+
+Hier zijn enkele artikelen over misleidende datavisualisatie:
+
+https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
+
+http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
+
+Bekijk deze interessante visualisaties van historische objecten en artefacten:
+
+https://handbook.pubpub.org/
+
+Lees dit artikel over hoe animatie je visualisaties kan verbeteren:
+
+https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
+
+## Opdracht
+
+[Maak je eigen aangepaste visualisatie](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/13-meaningful-visualizations/assignment.md b/translations/nl/3-Data-Visualization/13-meaningful-visualizations/assignment.md
new file mode 100644
index 00000000..d199aac1
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/13-meaningful-visualizations/assignment.md
@@ -0,0 +1,25 @@
+
+# Bouw je eigen aangepaste visualisatie
+
+## Instructies
+
+Gebruik de voorbeeldcode in dit project om een sociaal netwerk te creëren en maak zelf gegevens na van je eigen sociale interacties. Je kunt je gebruik van sociale media in kaart brengen of een diagram maken van je familieleden. Maak een interessante webapp die een unieke visualisatie van een sociaal netwerk toont.
+
+## Rubric
+
+Uitmuntend | Voldoende | Verbetering nodig
+--- | --- | --- |
+Een GitHub-repository wordt gepresenteerd met code die correct werkt (probeer het te implementeren als een statische webapp) en een geannoteerde README die het project uitlegt | De repository werkt niet correct of is niet goed gedocumenteerd | De repository werkt niet correct en is niet goed gedocumenteerd
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/13-meaningful-visualizations/solution/README.md b/translations/nl/3-Data-Visualization/13-meaningful-visualizations/solution/README.md
new file mode 100644
index 00000000..75070995
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/13-meaningful-visualizations/solution/README.md
@@ -0,0 +1,40 @@
+
+# Gevaarlijke Relaties data visualisatieproject
+
+Om te beginnen moet je ervoor zorgen dat je NPM en Node op je machine hebt draaien. Installeer de afhankelijkheden (npm install) en voer vervolgens het project lokaal uit (npm run serve):
+
+## Projectinstelling
+```
+npm install
+```
+
+### Compileert en herlaadt automatisch voor ontwikkeling
+```
+npm run serve
+```
+
+### Compileert en minimaliseert voor productie
+```
+npm run build
+```
+
+### Controleert en herstelt bestanden
+```
+npm run lint
+```
+
+### Configuratie aanpassen
+Zie [Configuratiereferentie](https://cli.vuejs.org/config/).
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/13-meaningful-visualizations/starter/README.md b/translations/nl/3-Data-Visualization/13-meaningful-visualizations/starter/README.md
new file mode 100644
index 00000000..f59efd78
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/13-meaningful-visualizations/starter/README.md
@@ -0,0 +1,40 @@
+
+# Gevaarlijke Relaties data visualisatieproject
+
+Om te beginnen moet je ervoor zorgen dat je NPM en Node op je machine hebt draaien. Installeer de afhankelijkheden (npm install) en voer vervolgens het project lokaal uit (npm run serve):
+
+## Projectinstelling
+```
+npm install
+```
+
+### Compileert en herlaadt automatisch voor ontwikkeling
+```
+npm run serve
+```
+
+### Compileert en minimaliseert voor productie
+```
+npm run build
+```
+
+### Controleert en herstelt bestanden
+```
+npm run lint
+```
+
+### Configuratie aanpassen
+Zie [Configuratiereferentie](https://cli.vuejs.org/config/).
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/R/09-visualization-quantities/README.md b/translations/nl/3-Data-Visualization/R/09-visualization-quantities/README.md
new file mode 100644
index 00000000..90824624
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/R/09-visualization-quantities/README.md
@@ -0,0 +1,230 @@
+
+# Visualiseren van hoeveelheden
+| ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/09-Visualizing-Quantities.png)|
+|:---:|
+| Visualiseren van hoeveelheden - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+In deze les leer je hoe je enkele van de vele beschikbare R-pakketten kunt gebruiken om interessante visualisaties te maken rondom het concept van hoeveelheden. Met behulp van een opgeschoonde dataset over de vogels van Minnesota kun je veel interessante feiten ontdekken over de lokale fauna.
+## [Quiz voorafgaand aan de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/16)
+
+## Observeer vleugelspanwijdte met ggplot2
+Een uitstekende bibliotheek om zowel eenvoudige als geavanceerde grafieken en diagrammen te maken is [ggplot2](https://cran.r-project.org/web/packages/ggplot2/index.html). Over het algemeen omvat het proces van het plotten van gegevens met deze bibliotheken het identificeren van de delen van je dataframe die je wilt gebruiken, het uitvoeren van eventuele noodzakelijke transformaties op die gegevens, het toewijzen van x- en y-aswaarden, het kiezen van het type plot, en vervolgens het weergeven van de plot.
+
+`ggplot2` is een systeem voor het declaratief maken van grafieken, gebaseerd op The Grammar of Graphics. De [Grammar of Graphics](https://en.wikipedia.org/wiki/Ggplot2) is een algemeen schema voor datavisualisatie dat grafieken opdeelt in semantische componenten zoals schalen en lagen. Met andere woorden, de eenvoud waarmee je grafieken kunt maken voor univariate of multivariate gegevens met weinig code maakt `ggplot2` het populairste pakket voor visualisaties in R. De gebruiker vertelt `ggplot2` hoe de variabelen aan esthetiek moeten worden gekoppeld, welke grafische primitieve moet worden gebruikt, en `ggplot2` regelt de rest.
+
+> ✅ Plot = Data + Esthetiek + Geometrie
+> - Data verwijst naar de dataset
+> - Esthetiek geeft de variabelen aan die worden bestudeerd (x- en y-variabelen)
+> - Geometrie verwijst naar het type plot (lijnplot, staafdiagram, enz.)
+
+Kies de beste geometrie (type plot) afhankelijk van je gegevens en het verhaal dat je wilt vertellen met de plot.
+
+> - Om trends te analyseren: lijn, kolom
+> - Om waarden te vergelijken: staaf, kolom, taartdiagram, spreidingsdiagram
+> - Om te laten zien hoe delen zich verhouden tot een geheel: taartdiagram
+> - Om de verdeling van gegevens te tonen: spreidingsdiagram, staafdiagram
+> - Om relaties tussen waarden te tonen: lijn, spreidingsdiagram, bubbel
+
+✅ Bekijk ook deze beschrijvende [cheatsheet](https://nyu-cdsc.github.io/learningr/assets/data-visualization-2.1.pdf) voor ggplot2.
+
+## Maak een lijnplot over vleugelspanwijdte van vogels
+
+Open de R-console en importeer de dataset.
+> Opmerking: De dataset is opgeslagen in de root van deze repo in de `/data` map.
+
+Laten we de dataset importeren en de head (bovenste 5 rijen) van de gegevens bekijken.
+
+```r
+birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
+head(birds)
+```
+De head van de gegevens bevat een mix van tekst en cijfers:
+
+| | Naam | WetenschappelijkeNaam | Categorie | Orde | Familie | Geslacht | Beschermingsstatus | MinLengte | MaxLengte | MinLichaamsgewicht | MaxLichaamsgewicht | MinVleugelspan | MaxVleugelspan |
+| ---: | :---------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | -----------------: | -----------------: | -------------: | -------------: |
+| 0 | Zwartbuikfluiteend | Dendrocygna autumnalis | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
+| 1 | Bruine fluiteend | Dendrocygna bicolor | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
+| 2 | Sneeuwgans | Anser caerulescens | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
+| 3 | Ross' gans | Anser rossii | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
+| 4 | Grote rietgans | Anser albifrons | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
+
+Laten we beginnen met het plotten van enkele numerieke gegevens met een eenvoudige lijnplot. Stel dat je een overzicht wilt van de maximale vleugelspanwijdte van deze interessante vogels.
+
+```r
+install.packages("ggplot2")
+library("ggplot2")
+ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
+ geom_line()
+```
+Hier installeer je het `ggplot2` pakket en importeer je het vervolgens in de werkruimte met het commando `library("ggplot2")`. Om een plot te maken in ggplot, gebruik je de functie `ggplot()` en specificeer je de dataset, x- en y-variabelen als attributen. In dit geval gebruiken we de functie `geom_line()` omdat we een lijnplot willen maken.
+
+
+
+Wat valt je meteen op? Er lijkt minstens één uitschieter te zijn - dat is een behoorlijke vleugelspanwijdte! Een vleugelspanwijdte van meer dan 2000 centimeter komt overeen met meer dan 20 meter - zijn er Pterodactylen in Minnesota? Laten we dit onderzoeken.
+
+Hoewel je snel zou kunnen sorteren in Excel om die uitschieters te vinden, die waarschijnlijk typfouten zijn, gaan we verder met het visualisatieproces vanuit de plot.
+
+Voeg labels toe aan de x-as om te laten zien om welke soorten vogels het gaat:
+
+```r
+ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
+ geom_line() +
+ theme(axis.text.x = element_text(angle = 45, hjust=1))+
+ xlab("Birds") +
+ ylab("Wingspan (CM)") +
+ ggtitle("Max Wingspan in Centimeters")
+```
+We specificeren de hoek in het `theme` en geven de x- en y-as labels met `xlab()` en `ylab()` respectievelijk. De `ggtitle()` geeft een naam aan de grafiek/plot.
+
+
+
+Zelfs met de rotatie van de labels ingesteld op 45 graden, zijn er te veel om te lezen. Laten we een andere strategie proberen: label alleen die uitschieters en plaats de labels binnen de grafiek. Je kunt een spreidingsdiagram gebruiken om meer ruimte te maken voor de labeling:
+
+```r
+ggplot(data=birds, aes(x=Name, y=MaxWingspan,group=1)) +
+ geom_point() +
+ geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
+ theme(axis.title.x=element_blank(), axis.text.x=element_blank(), axis.ticks.x=element_blank())
+ ylab("Wingspan (CM)") +
+ ggtitle("Max Wingspan in Centimeters") +
+```
+Wat gebeurt hier? Je hebt de functie `geom_point()` gebruikt om spreidingspunten te plotten. Hiermee heb je labels toegevoegd voor vogels met een `MaxWingspan > 500` en ook de labels op de x-as verborgen om de plot overzichtelijker te maken.
+
+Wat ontdek je?
+
+
+
+## Filter je gegevens
+
+Zowel de Amerikaanse zeearend als de Prairievalk lijken, hoewel waarschijnlijk zeer grote vogels, verkeerd gelabeld te zijn, met een extra 0 toegevoegd aan hun maximale vleugelspanwijdte. Het is onwaarschijnlijk dat je een Amerikaanse zeearend tegenkomt met een vleugelspanwijdte van 25 meter, maar als dat zo is, laat het ons dan weten! Laten we een nieuwe dataframe maken zonder die twee uitschieters:
+
+```r
+birds_filtered <- subset(birds, MaxWingspan < 500)
+
+ggplot(data=birds_filtered, aes(x=Name, y=MaxWingspan,group=1)) +
+ geom_point() +
+ ylab("Wingspan (CM)") +
+ xlab("Birds") +
+ ggtitle("Max Wingspan in Centimeters") +
+ geom_text(aes(label=ifelse(MaxWingspan>500,as.character(Name),'')),hjust=0,vjust=0) +
+ theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())
+```
+We hebben een nieuwe dataframe `birds_filtered` gemaakt en vervolgens een spreidingsdiagram geplot. Door uitschieters te filteren, zijn je gegevens nu meer samenhangend en begrijpelijk.
+
+
+
+Nu we een schonere dataset hebben, althans wat betreft vleugelspanwijdte, laten we meer ontdekken over deze vogels.
+
+Hoewel lijn- en spreidingsdiagrammen informatie kunnen tonen over gegevenswaarden en hun verdelingen, willen we nadenken over de waarden die inherent zijn aan deze dataset. Je zou visualisaties kunnen maken om de volgende vragen over hoeveelheden te beantwoorden:
+
+> Hoeveel categorieën vogels zijn er, en wat zijn hun aantallen?
+> Hoeveel vogels zijn uitgestorven, bedreigd, zeldzaam of algemeen?
+> Hoeveel zijn er van de verschillende geslachten en orden in de terminologie van Linnaeus?
+## Verken staafdiagrammen
+
+Staafdiagrammen zijn praktisch wanneer je groeperingen van gegevens wilt tonen. Laten we de categorieën van vogels in deze dataset verkennen om te zien welke het meest voorkomt qua aantal.
+Laten we een staafdiagram maken op gefilterde gegevens.
+
+```r
+install.packages("dplyr")
+install.packages("tidyverse")
+
+library(lubridate)
+library(scales)
+library(dplyr)
+library(ggplot2)
+library(tidyverse)
+
+birds_filtered %>% group_by(Category) %>%
+ summarise(n=n(),
+ MinLength = mean(MinLength),
+ MaxLength = mean(MaxLength),
+ MinBodyMass = mean(MinBodyMass),
+ MaxBodyMass = mean(MaxBodyMass),
+ MinWingspan=mean(MinWingspan),
+ MaxWingspan=mean(MaxWingspan)) %>%
+ gather("key", "value", - c(Category, n)) %>%
+ ggplot(aes(x = Category, y = value, group = key, fill = key)) +
+ geom_bar(stat = "identity") +
+ scale_fill_manual(values = c("#D62728", "#FF7F0E", "#8C564B","#2CA02C", "#1F77B4", "#9467BD")) +
+ xlab("Category")+ggtitle("Birds of Minnesota")
+
+```
+In de volgende snippet installeren we de [dplyr](https://www.rdocumentation.org/packages/dplyr/versions/0.7.8) en [lubridate](https://www.rdocumentation.org/packages/lubridate/versions/1.8.0) pakketten om gegevens te manipuleren en te groeperen om een gestapeld staafdiagram te plotten. Eerst groepeer je de gegevens op de `Category` van de vogel en vat je de kolommen `MinLength`, `MaxLength`, `MinBodyMass`, `MaxBodyMass`, `MinWingspan`, `MaxWingspan` samen. Vervolgens plot je het staafdiagram met het `ggplot2` pakket en specificeer je de kleuren voor de verschillende categorieën en de labels.
+
+
+
+Dit staafdiagram is echter onleesbaar omdat er te veel niet-gegroepeerde gegevens zijn. Je moet alleen de gegevens selecteren die je wilt plotten, dus laten we kijken naar de lengte van vogels op basis van hun categorie.
+
+Filter je gegevens om alleen de categorie van de vogel op te nemen.
+
+Omdat er veel categorieën zijn, kun je deze grafiek verticaal weergeven en de hoogte aanpassen om rekening te houden met alle gegevens:
+
+```r
+birds_count<-dplyr::count(birds_filtered, Category, sort = TRUE)
+birds_count$Category <- factor(birds_count$Category, levels = birds_count$Category)
+ggplot(birds_count,aes(Category,n))+geom_bar(stat="identity")+coord_flip()
+```
+Je telt eerst unieke waarden in de `Category` kolom en sorteert ze vervolgens in een nieuwe dataframe `birds_count`. Deze gesorteerde gegevens worden vervolgens op hetzelfde niveau gefactoreerd zodat ze op een gesorteerde manier worden geplot. Met `ggplot2` plot je vervolgens de gegevens in een staafdiagram. De `coord_flip()` plot horizontale balken.
+
+
+
+Dit staafdiagram geeft een goed overzicht van het aantal vogels in elke categorie. In één oogopslag zie je dat het grootste aantal vogels in deze regio behoort tot de categorie Eenden/Ganzen/Watervogels. Minnesota is het 'land van 10.000 meren', dus dit is niet verrassend!
+
+✅ Probeer enkele andere tellingen op deze dataset. Verrast iets je?
+
+## Gegevens vergelijken
+
+Je kunt verschillende vergelijkingen van gegroepeerde gegevens proberen door nieuwe assen te maken. Probeer een vergelijking van de MaxLength van een vogel, gebaseerd op zijn categorie:
+
+```r
+birds_grouped <- birds_filtered %>%
+ group_by(Category) %>%
+ summarise(
+ MaxLength = max(MaxLength, na.rm = T),
+ MinLength = max(MinLength, na.rm = T)
+ ) %>%
+ arrange(Category)
+
+ggplot(birds_grouped,aes(Category,MaxLength))+geom_bar(stat="identity")+coord_flip()
+```
+We groeperen de `birds_filtered` gegevens op `Category` en plotten vervolgens een staafdiagram.
+
+
+
+Hier is niets verrassends: kolibries hebben de minste MaxLength in vergelijking met pelikanen of ganzen. Het is goed wanneer gegevens logisch zijn!
+
+Je kunt interessantere visualisaties van staafdiagrammen maken door gegevens te superponeren. Laten we Minimum en Maximum Lengte superponeren op een gegeven vogelcategorie:
+
+```r
+ggplot(data=birds_grouped, aes(x=Category)) +
+ geom_bar(aes(y=MaxLength), stat="identity", position ="identity", fill='blue') +
+ geom_bar(aes(y=MinLength), stat="identity", position="identity", fill='orange')+
+ coord_flip()
+```
+
+
+## 🚀 Uitdaging
+
+Deze vogeldataset biedt een schat aan informatie over verschillende soorten vogels binnen een bepaald ecosysteem. Zoek op internet en kijk of je andere vogelgerichte datasets kunt vinden. Oefen met het maken van grafieken en diagrammen over deze vogels om feiten te ontdekken die je niet kende.
+## [Quiz na de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/17)
+
+## Review & Zelfstudie
+
+Deze eerste les heeft je wat informatie gegeven over hoe je `ggplot2` kunt gebruiken om hoeveelheden te visualiseren. Doe wat onderzoek naar andere manieren om met datasets te werken voor visualisatie. Zoek en onderzoek datasets die je zou kunnen visualiseren met andere pakketten zoals [Lattice](https://stat.ethz.ch/R-manual/R-devel/library/lattice/html/Lattice.html) en [Plotly](https://github.com/plotly/plotly.R#readme).
+
+## Opdracht
+[Lijnen, Spreidingsdiagrammen en Staafdiagrammen](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/R/09-visualization-quantities/assignment.md b/translations/nl/3-Data-Visualization/R/09-visualization-quantities/assignment.md
new file mode 100644
index 00000000..8c39e5bd
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/R/09-visualization-quantities/assignment.md
@@ -0,0 +1,25 @@
+
+# Lijnen, Spreidingsdiagrammen en Staafdiagrammen
+
+## Instructies
+
+In deze les heb je gewerkt met lijndiagrammen, spreidingsdiagrammen en staafdiagrammen om interessante feiten over deze dataset te laten zien. In deze opdracht ga je dieper in op de dataset om een feit over een bepaald type vogel te ontdekken. Maak bijvoorbeeld een script dat alle interessante gegevens visualiseert die je kunt vinden over Sneeuwganzen. Gebruik de drie hierboven genoemde diagrammen om een verhaal te vertellen in je notebook.
+
+## Beoordelingscriteria
+
+Uitmuntend | Voldoende | Verbetering Nodig
+--- | --- | -- |
+Een script wordt gepresenteerd met goede annotaties, een sterke verhaallijn en aantrekkelijke grafieken | Het script mist een van deze elementen | Het script mist twee van deze elementen
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/R/10-visualization-distributions/README.md b/translations/nl/3-Data-Visualization/R/10-visualization-distributions/README.md
new file mode 100644
index 00000000..5fd00699
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/R/10-visualization-distributions/README.md
@@ -0,0 +1,183 @@
+
+# Visualiseren van distributies
+
+| ](https://github.com/microsoft/Data-Science-For-Beginners/blob/main/sketchnotes/10-Visualizing-Distributions.png)|
+|:---:|
+| Visualiseren van distributies - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+In de vorige les heb je enkele interessante feiten geleerd over een dataset over de vogels van Minnesota. Je hebt foutieve gegevens gevonden door uitschieters te visualiseren en keek naar de verschillen tussen vogelcategorieën op basis van hun maximale lengte.
+
+## [Quiz voorafgaand aan de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/18)
+## Verken de vogeldataset
+
+Een andere manier om gegevens te onderzoeken is door te kijken naar de distributie, of hoe de gegevens langs een as zijn georganiseerd. Misschien wil je bijvoorbeeld meer weten over de algemene distributie, voor deze dataset, van de maximale vleugelspanwijdte of maximale lichaamsmassa van de vogels van Minnesota.
+
+Laten we enkele feiten ontdekken over de distributies van gegevens in deze dataset. Importeer in je R-console `ggplot2` en de database. Verwijder de uitschieters uit de database, net zoals in het vorige onderwerp.
+
+```r
+library(ggplot2)
+
+birds <- read.csv("../../data/birds.csv",fileEncoding="UTF-8-BOM")
+
+birds_filtered <- subset(birds, MaxWingspan < 500)
+head(birds_filtered)
+```
+| | Naam | WetenschappelijkeNaam | Categorie | Orde | Familie | Geslacht | Beschermingsstatus | MinLengte | MaxLengte | MinLichaamsmassa | MaxLichaamsmassa | MinVleugelspan | MaxVleugelspan |
+| ---: | :--------------------------- | :--------------------- | :-------------------- | :----------- | :------- | :---------- | :----------------- | --------: | --------: | --------------: | --------------: | -------------: | -------------: |
+| 0 | Zwartbuikfluiteend | Dendrocygna autumnalis | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Dendrocygna | LC | 47 | 56 | 652 | 1020 | 76 | 94 |
+| 1 | Rosse fluiteend | Dendrocygna bicolor | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Dendrocygna | LC | 45 | 53 | 712 | 1050 | 85 | 93 |
+| 2 | Sneeuwgans | Anser caerulescens | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 64 | 79 | 2050 | 4050 | 135 | 165 |
+| 3 | Ross' gans | Anser rossii | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 57.3 | 64 | 1066 | 1567 | 113 | 116 |
+| 4 | Grote rietgans | Anser albifrons | Eenden/Ganzen/Watervogels | Anseriformes | Anatidae | Anser | LC | 64 | 81 | 1930 | 3310 | 130 | 165 |
+
+Over het algemeen kun je snel kijken naar hoe gegevens zijn verdeeld door een spreidingsdiagram te gebruiken, zoals we in de vorige les deden:
+
+```r
+ggplot(data=birds_filtered, aes(x=Order, y=MaxLength,group=1)) +
+ geom_point() +
+ ggtitle("Max Length per order") + coord_flip()
+```
+
+
+Dit geeft een overzicht van de algemene verdeling van lichaamslengte per vogelorde, maar het is niet de optimale manier om echte distributies weer te geven. Die taak wordt meestal uitgevoerd door een histogram te maken.
+## Werken met histogrammen
+
+`ggplot2` biedt zeer goede manieren om gegevensdistributie te visualiseren met behulp van histogrammen. Dit type diagram lijkt op een staafdiagram waarbij de distributie kan worden gezien via een stijging en daling van de staven. Om een histogram te maken, heb je numerieke gegevens nodig. Om een histogram te maken, kun je een diagram plotten waarbij je het type definieert als 'hist' voor histogram. Dit diagram toont de distributie van MaxBodyMass voor het volledige bereik van numerieke gegevens in de dataset. Door de reeks gegevens op te splitsen in kleinere bins, kan het de distributie van de waarden van de gegevens weergeven:
+
+```r
+ggplot(data = birds_filtered, aes(x = MaxBodyMass)) +
+ geom_histogram(bins=10)+ylab('Frequency')
+```
+
+
+Zoals je kunt zien, valt het merendeel van de 400+ vogels in deze dataset in het bereik van minder dan 2000 voor hun maximale lichaamsmassa. Krijg meer inzicht in de gegevens door de parameter `bins` te wijzigen naar een hoger aantal, bijvoorbeeld 30:
+
+```r
+ggplot(data = birds_filtered, aes(x = MaxBodyMass)) + geom_histogram(bins=30)+ylab('Frequency')
+```
+
+
+
+Dit diagram toont de distributie op een iets meer gedetailleerde manier. Een diagram dat minder naar links is scheefgetrokken, kan worden gemaakt door ervoor te zorgen dat je alleen gegevens selecteert binnen een bepaald bereik:
+
+Filter je gegevens om alleen die vogels te krijgen waarvan de lichaamsmassa onder de 60 ligt, en toon 30 `bins`:
+
+```r
+birds_filtered_1 <- subset(birds_filtered, MaxBodyMass > 1 & MaxBodyMass < 60)
+ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
+ geom_histogram(bins=30)+ylab('Frequency')
+```
+
+
+
+✅ Probeer enkele andere filters en gegevenspunten. Om de volledige distributie van de gegevens te zien, verwijder je de `['MaxBodyMass']` filter om gelabelde distributies weer te geven.
+
+Het histogram biedt ook enkele leuke kleur- en labelverbeteringen om te proberen:
+
+Maak een 2D-histogram om de relatie tussen twee distributies te vergelijken. Laten we `MaxBodyMass` vergelijken met `MaxLength`. `ggplot2` biedt een ingebouwde manier om convergentie te tonen met behulp van helderdere kleuren:
+
+```r
+ggplot(data=birds_filtered_1, aes(x=MaxBodyMass, y=MaxLength) ) +
+ geom_bin2d() +scale_fill_continuous(type = "viridis")
+```
+Er lijkt een verwachte correlatie te zijn tussen deze twee elementen langs een verwachte as, met één bijzonder sterk convergentiepunt:
+
+
+
+Histogrammen werken standaard goed voor numerieke gegevens. Wat als je distributies wilt zien op basis van tekstgegevens?
+## Verken de dataset voor distributies met behulp van tekstgegevens
+
+Deze dataset bevat ook goede informatie over de vogelcategorie en zijn geslacht, soort en familie, evenals zijn beschermingsstatus. Laten we deze beschermingsinformatie onderzoeken. Wat is de distributie van de vogels volgens hun beschermingsstatus?
+
+> ✅ In de dataset worden verschillende acroniemen gebruikt om de beschermingsstatus te beschrijven. Deze acroniemen komen van de [IUCN Red List Categories](https://www.iucnredlist.org/), een organisatie die de status van soorten catalogiseert.
+>
+> - CR: Kritiek Bedreigd
+> - EN: Bedreigd
+> - EX: Uitgestorven
+> - LC: Minste Zorg
+> - NT: Bijna Bedreigd
+> - VU: Kwetsbaar
+
+Dit zijn tekstgebaseerde waarden, dus je moet een transformatie uitvoeren om een histogram te maken. Gebruik de filteredBirds dataframe om de beschermingsstatus weer te geven naast de minimale vleugelspanwijdte. Wat zie je?
+
+```r
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EX'] <- 'x1'
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'CR'] <- 'x2'
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'EN'] <- 'x3'
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'NT'] <- 'x4'
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'VU'] <- 'x5'
+birds_filtered_1$ConservationStatus[birds_filtered_1$ConservationStatus == 'LC'] <- 'x6'
+
+ggplot(data=birds_filtered_1, aes(x = MinWingspan, fill = ConservationStatus)) +
+ geom_histogram(position = "identity", alpha = 0.4, bins = 20) +
+ scale_fill_manual(name="Conservation Status",values=c("red","green","blue","pink"),labels=c("Endangered","Near Threathened","Vulnerable","Least Concern"))
+```
+
+
+
+Er lijkt geen goede correlatie te zijn tussen minimale vleugelspanwijdte en beschermingsstatus. Test andere elementen van de dataset met deze methode. Je kunt ook verschillende filters proberen. Vind je enige correlatie?
+
+## Dichtheidsdiagrammen
+
+Je hebt misschien gemerkt dat de histogrammen die we tot nu toe hebben bekeken 'getrapt' zijn en niet soepel in een boog verlopen. Om een vloeiender dichtheidsdiagram te tonen, kun je een dichtheidsplot proberen.
+
+Laten we nu werken met dichtheidsdiagrammen!
+
+```r
+ggplot(data = birds_filtered_1, aes(x = MinWingspan)) +
+ geom_density()
+```
+
+
+Je kunt zien hoe het diagram het vorige voor minimale vleugelspanwijdte gegevens weerspiegelt; het is gewoon iets vloeiender. Als je die hoekige MaxBodyMass-lijn in het tweede diagram dat je hebt gemaakt opnieuw wilt bekijken, kun je deze heel goed gladstrijken door deze opnieuw te maken met deze methode:
+
+```r
+ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
+ geom_density()
+```
+
+
+Als je een gladde, maar niet te gladde lijn wilt, bewerk dan de parameter `adjust`:
+
+```r
+ggplot(data = birds_filtered_1, aes(x = MaxBodyMass)) +
+ geom_density(adjust = 1/5)
+```
+
+
+✅ Lees over de beschikbare parameters voor dit type diagram en experimenteer!
+
+Dit type diagram biedt prachtig verklarende visualisaties. Met een paar regels code kun je bijvoorbeeld de maximale lichaamsmassa dichtheid per vogelorde tonen:
+
+```r
+ggplot(data=birds_filtered_1,aes(x = MaxBodyMass, fill = Order)) +
+ geom_density(alpha=0.5)
+```
+
+
+## 🚀 Uitdaging
+
+Histogrammen zijn een meer geavanceerd type diagram dan eenvoudige spreidingsdiagrammen, staafdiagrammen of lijndiagrammen. Ga op zoek op het internet naar goede voorbeelden van het gebruik van histogrammen. Hoe worden ze gebruikt, wat tonen ze aan, en in welke velden of gebieden van onderzoek worden ze vaak gebruikt?
+
+## [Quiz na de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/19)
+
+## Herziening & Zelfstudie
+
+In deze les heb je `ggplot2` gebruikt en ben je begonnen met het maken van meer geavanceerde diagrammen. Doe wat onderzoek naar `geom_density_2d()` een "continue waarschijnlijkheidsdichtheidscurve in één of meer dimensies". Lees de [documentatie](https://ggplot2.tidyverse.org/reference/geom_density_2d.html) om te begrijpen hoe het werkt.
+
+## Opdracht
+
+[Pas je vaardigheden toe](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/R/10-visualization-distributions/assignment.md b/translations/nl/3-Data-Visualization/R/10-visualization-distributions/assignment.md
new file mode 100644
index 00000000..c5a5ceda
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/R/10-visualization-distributions/assignment.md
@@ -0,0 +1,25 @@
+
+# Pas je vaardigheden toe
+
+## Instructies
+
+Tot nu toe heb je gewerkt met de Minnesota vogels dataset om informatie te ontdekken over vogelhoeveelheden en populatiedichtheid. Oefen het toepassen van deze technieken door een andere dataset te proberen, mogelijk afkomstig van [Kaggle](https://www.kaggle.com/). Bouw een R-script om een verhaal te vertellen over deze dataset en zorg ervoor dat je histogrammen gebruikt bij het bespreken ervan.
+
+## Rubric
+
+Uitmuntend | Voldoende | Verbetering nodig
+--- | --- | -- |
+Een script wordt gepresenteerd met annotaties over deze dataset, inclusief de bron, en gebruikt minstens 5 histogrammen om feiten over de data te ontdekken. | Een script wordt gepresenteerd met incomplete annotaties of fouten. | Een script wordt gepresenteerd zonder annotaties en bevat fouten.
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/R/11-visualization-proportions/README.md b/translations/nl/3-Data-Visualization/R/11-visualization-proportions/README.md
new file mode 100644
index 00000000..423269cc
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/R/11-visualization-proportions/README.md
@@ -0,0 +1,199 @@
+
+# Visualiseren van Verhoudingen
+
+| ](../../../sketchnotes/11-Visualizing-Proportions.png)|
+|:---:|
+|Visualiseren van Verhoudingen - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+In deze les gebruik je een dataset met een focus op de natuur om verhoudingen te visualiseren, zoals hoeveel verschillende soorten paddenstoelen voorkomen in een gegeven dataset over champignons. Laten we deze fascinerende schimmels verkennen met een dataset afkomstig van Audubon, waarin details staan over 23 soorten plaatjeszwammen in de Agaricus- en Lepiota-families. Je gaat experimenteren met smakelijke visualisaties zoals:
+
+- Taartdiagrammen 🥧
+- Donutdiagrammen 🍩
+- Wafeldiagrammen 🧇
+
+> 💡 Een zeer interessant project genaamd [Charticulator](https://charticulator.com) van Microsoft Research biedt een gratis drag-and-drop interface voor datavisualisaties. In een van hun tutorials gebruiken ze ook deze champignon-dataset! Zo kun je de data verkennen en tegelijkertijd de bibliotheek leren kennen: [Charticulator tutorial](https://charticulator.com/tutorials/tutorial4.html).
+
+## [Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/20)
+
+## Leer je champignons kennen 🍄
+
+Champignons zijn erg interessant. Laten we een dataset importeren om ze te bestuderen:
+
+```r
+mushrooms = read.csv('../../data/mushrooms.csv')
+head(mushrooms)
+```
+Een tabel wordt weergegeven met geweldige data voor analyse:
+
+
+| klasse | hoedvorm | hoedoppervlak | hoedkleur | kneuzingen | geur | plaatjesbevestiging | plaatjesafstand | plaatjesgrootte | plaatjeskleur | steelvorm | steelbasis | steeloppervlak-boven-ring | steeloppervlak-onder-ring | steelkleur-boven-ring | steelkleur-onder-ring | sluier-type | sluierkleur | ring-aantal | ring-type | sporenkleur | populatie | habitat |
+| --------- | --------- | ------------- | --------- | ---------- | -------- | ------------------- | ---------------- | --------------- | ------------- | ----------- | ---------- | ------------------------ | ------------------------ | --------------------- | --------------------- | ----------- | ----------- | ----------- | --------- | ----------------- | ---------- | ------- |
+| Giftig | Bolvormig | Glad | Bruin | Kneuzingen | Scherp | Vrij | Dicht | Smal | Zwart | Breder | Gelijk | Glad | Glad | Wit | Wit | Gedeeltelijk| Wit | Eén | Hangend | Zwart | Verspreid | Stedelijk |
+| Eetbaar | Bolvormig | Glad | Geel | Kneuzingen | Amandel | Vrij | Dicht | Breed | Zwart | Breder | Knotsvormig| Glad | Glad | Wit | Wit | Gedeeltelijk| Wit | Eén | Hangend | Bruin | Talrijk | Grasland |
+| Eetbaar | Klokvormig| Glad | Wit | Kneuzingen | Anijs | Vrij | Dicht | Breed | Bruin | Breder | Knotsvormig| Glad | Glad | Wit | Wit | Gedeeltelijk| Wit | Eén | Hangend | Bruin | Talrijk | Weiden |
+| Giftig | Bolvormig | Schilferig | Wit | Kneuzingen | Scherp | Vrij | Dicht | Smal | Bruin | Breder | Gelijk | Glad | Glad | Wit | Wit | Gedeeltelijk| Wit | Eén | Hangend | Zwart | Verspreid | Stedelijk |
+| Eetbaar | Bolvormig | Glad | Groen | Geen kneuzingen | Geen | Vrij | Dicht | Breed | Zwart | Taps | Gelijk | Glad | Glad | Wit | Wit | Gedeeltelijk| Wit | Eén | Vergankelijk | Bruin | Overvloedig| Grasland |
+| Eetbaar | Bolvormig | Schilferig | Geel | Kneuzingen | Amandel | Vrij | Dicht | Breed | Bruin | Breder | Knotsvormig| Glad | Glad | Wit | Wit | Gedeeltelijk| Wit | Eén | Hangend | Zwart | Talrijk | Grasland |
+
+Je merkt meteen dat alle data tekstueel is. Je zult deze data moeten converteren om het te kunnen gebruiken in een diagram. De meeste data is feitelijk weergegeven als een object:
+
+```r
+names(mushrooms)
+```
+
+De output is:
+
+```output
+[1] "class" "cap.shape"
+ [3] "cap.surface" "cap.color"
+ [5] "bruises" "odor"
+ [7] "gill.attachment" "gill.spacing"
+ [9] "gill.size" "gill.color"
+[11] "stalk.shape" "stalk.root"
+[13] "stalk.surface.above.ring" "stalk.surface.below.ring"
+[15] "stalk.color.above.ring" "stalk.color.below.ring"
+[17] "veil.type" "veil.color"
+[19] "ring.number" "ring.type"
+[21] "spore.print.color" "population"
+[23] "habitat"
+```
+Neem deze data en converteer de 'klasse'-kolom naar een categorie:
+
+```r
+library(dplyr)
+grouped=mushrooms %>%
+ group_by(class) %>%
+ summarise(count=n())
+```
+
+Nu, als je de champignondata print, kun je zien dat het is gegroepeerd in categorieën volgens de giftige/eetbare klasse:
+```r
+View(grouped)
+```
+
+| klasse | aantal |
+| --------- | ------ |
+| Eetbaar | 4208 |
+| Giftig | 3916 |
+
+Als je de volgorde in deze tabel aanhoudt om je klassecategorie-labels te maken, kun je een taartdiagram bouwen.
+
+## Taart!
+
+```r
+pie(grouped$count,grouped$class, main="Edible?")
+```
+Voila, een taartdiagram dat de verhoudingen van deze data toont volgens deze twee klassen van champignons. Het is erg belangrijk om de volgorde van de labels correct te krijgen, vooral hier, dus zorg ervoor dat je de volgorde controleert waarmee de labelarray is gebouwd!
+
+
+
+## Donuts!
+
+Een visueel interessanter taartdiagram is een donutdiagram, wat een taartdiagram is met een gat in het midden. Laten we onze data bekijken met deze methode.
+
+Bekijk de verschillende habitats waar champignons groeien:
+
+```r
+library(dplyr)
+habitat=mushrooms %>%
+ group_by(habitat) %>%
+ summarise(count=n())
+View(habitat)
+```
+De output is:
+| habitat | aantal |
+| --------- | ------ |
+| Grasland | 2148 |
+| Bladeren | 832 |
+| Weiden | 292 |
+| Paden | 1144 |
+| Stedelijk | 368 |
+| Afval | 192 |
+| Hout | 3148 |
+
+Hier groepeer je je data op habitat. Er zijn 7 vermeld, dus gebruik die als labels voor je donutdiagram:
+
+```r
+library(ggplot2)
+library(webr)
+PieDonut(habitat, aes(habitat, count=count))
+```
+
+
+
+Deze code gebruikt de twee bibliotheken - ggplot2 en webr. Met de PieDonut-functie van de webr-bibliotheek kun je eenvoudig een donutdiagram maken!
+
+Donutdiagrammen in R kunnen ook alleen met de ggplot2-bibliotheek worden gemaakt. Je kunt er meer over leren [hier](https://www.r-graph-gallery.com/128-ring-or-donut-plot.html) en het zelf proberen.
+
+Nu je weet hoe je je data kunt groeperen en weergeven als een taart- of donutdiagram, kun je andere soorten diagrammen verkennen. Probeer een wafeldiagram, wat gewoon een andere manier is om hoeveelheden te verkennen.
+
+## Wafels!
+
+Een 'wafel'-type diagram is een andere manier om hoeveelheden te visualiseren als een 2D-array van vierkanten. Probeer de verschillende hoeveelheden champignonhoedkleuren in deze dataset te visualiseren. Hiervoor moet je een hulpbibliotheek genaamd [waffle](https://cran.r-project.org/web/packages/waffle/waffle.pdf) installeren en gebruiken om je visualisatie te genereren:
+
+```r
+install.packages("waffle", repos = "https://cinc.rud.is")
+```
+
+Selecteer een segment van je data om te groeperen:
+
+```r
+library(dplyr)
+cap_color=mushrooms %>%
+ group_by(cap.color) %>%
+ summarise(count=n())
+View(cap_color)
+```
+
+Maak een wafeldiagram door labels te maken en vervolgens je data te groeperen:
+
+```r
+library(waffle)
+names(cap_color$count) = paste0(cap_color$cap.color)
+waffle((cap_color$count/10), rows = 7, title = "Waffle Chart")+scale_fill_manual(values=c("brown", "#F0DC82", "#D2691E", "green",
+ "pink", "purple", "red", "grey",
+ "yellow","white"))
+```
+
+Met een wafeldiagram kun je duidelijk de verhoudingen van hoedkleuren in deze champignon-dataset zien. Interessant genoeg zijn er veel champignons met groene hoeden!
+
+
+
+In deze les heb je drie manieren geleerd om verhoudingen te visualiseren. Eerst moet je je data groeperen in categorieën en vervolgens beslissen wat de beste manier is om de data weer te geven - taart, donut of wafel. Allemaal zijn ze smakelijk en geven de gebruiker een direct overzicht van een dataset.
+
+## 🚀 Uitdaging
+
+Probeer deze smakelijke diagrammen opnieuw te maken in [Charticulator](https://charticulator.com).
+
+## [Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/21)
+
+## Review & Zelfstudie
+
+Soms is het niet duidelijk wanneer je een taart-, donut- of wafeldiagram moet gebruiken. Hier zijn enkele artikelen om hierover te lezen:
+
+https://www.beautiful.ai/blog/battle-of-the-charts-pie-chart-vs-donut-chart
+
+https://medium.com/@hypsypops/pie-chart-vs-donut-chart-showdown-in-the-ring-5d24fd86a9ce
+
+https://www.mit.edu/~mbarker/formula1/f1help/11-ch-c6.htm
+
+https://medium.datadriveninvestor.com/data-visualization-done-the-right-way-with-tableau-waffle-chart-fdf2a19be402
+
+Doe wat onderzoek om meer informatie te vinden over deze lastige beslissing.
+
+## Opdracht
+
+[Probeer het in Excel](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/R/12-visualization-relationships/README.md b/translations/nl/3-Data-Visualization/R/12-visualization-relationships/README.md
new file mode 100644
index 00000000..42bb9a9c
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/R/12-visualization-relationships/README.md
@@ -0,0 +1,177 @@
+
+# Relaties Visualiseren: Alles Over Honing 🍯
+
+| ](../../../sketchnotes/12-Visualizing-Relationships.png)|
+|:---:|
+|Relaties Visualiseren - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+In navolging van de natuurfocus van ons onderzoek, laten we interessante visualisaties ontdekken om de relaties tussen verschillende soorten honing te laten zien, gebaseerd op een dataset van het [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
+
+Deze dataset, met ongeveer 600 items, toont de honingproductie in veel Amerikaanse staten. Je kunt bijvoorbeeld kijken naar het aantal bijenkolonies, de opbrengst per kolonie, de totale productie, voorraden, prijs per pond en de waarde van de geproduceerde honing in een bepaalde staat van 1998-2012, met één rij per jaar per staat.
+
+Het is interessant om de relatie te visualiseren tussen de productie van een staat per jaar en bijvoorbeeld de honingprijs in die staat. Een andere mogelijkheid is om de opbrengst per kolonie tussen staten te vergelijken. Deze periode omvat ook de verwoestende 'CCD' of 'Colony Collapse Disorder', die voor het eerst werd waargenomen in 2006 (http://npic.orst.edu/envir/ccd.html), wat deze dataset extra betekenisvol maakt. 🐝
+
+## [Quiz vóór de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/22)
+
+In deze les kun je ggplot2 gebruiken, een bibliotheek die je al eerder hebt gebruikt, om relaties tussen variabelen te visualiseren. Vooral interessant is het gebruik van de `geom_point` en `qplot` functies van ggplot2, waarmee je snel scatterplots en lijndiagrammen kunt maken om '[statistische relaties](https://ggplot2.tidyverse.org/)' te onderzoeken. Dit helpt datawetenschappers om beter te begrijpen hoe variabelen zich tot elkaar verhouden.
+
+## Scatterplots
+
+Gebruik een scatterplot om te laten zien hoe de prijs van honing zich per jaar per staat heeft ontwikkeld. Met ggplot2 kun je, door gebruik te maken van `ggplot` en `geom_point`, de gegevens per staat groeperen en datapunten weergeven voor zowel categorische als numerieke gegevens.
+
+Laten we beginnen met het importeren van de data en Seaborn:
+
+```r
+honey=read.csv('../../data/honey.csv')
+head(honey)
+```
+Je merkt dat de honingdata verschillende interessante kolommen bevat, waaronder jaar en prijs per pond. Laten we deze data verkennen, gegroepeerd per Amerikaanse staat:
+
+| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | jaar |
+| ----- | ------ | ----------- | --------- | -------- | ---------- | --------- | ---- |
+| AL | 16000 | 71 | 1136000 | 159000 | 0.72 | 818000 | 1998 |
+| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
+| AR | 53000 | 65 | 3445000 | 1688000 | 0.59 | 2033000 | 1998 |
+| CA | 450000 | 83 | 37350000 | 12326000 | 0.62 | 23157000 | 1998 |
+| CO | 27000 | 72 | 1944000 | 1594000 | 0.7 | 1361000 | 1998 |
+| FL | 230000 | 98 |22540000 | 4508000 | 0.64 | 14426000 | 1998 |
+
+Maak een eenvoudige scatterplot om de relatie tussen de prijs per pond honing en de staat van herkomst te laten zien. Zorg ervoor dat de `y`-as hoog genoeg is om alle staten weer te geven:
+
+```r
+library(ggplot2)
+ggplot(honey, aes(x = priceperlb, y = state)) +
+ geom_point(colour = "blue")
+```
+
+
+Laat nu dezelfde data zien met een honingkleurenschema om te laten zien hoe de prijs zich door de jaren heen ontwikkelt. Dit kun je doen door een 'scale_color_gradientn'-parameter toe te voegen om de verandering per jaar weer te geven:
+
+> ✅ Lees meer over de [scale_color_gradientn](https://www.rdocumentation.org/packages/ggplot2/versions/0.9.1/topics/scale_colour_gradientn) - probeer een prachtig regenboogkleurenschema!
+
+```r
+ggplot(honey, aes(x = priceperlb, y = state, color=year)) +
+ geom_point()+scale_color_gradientn(colours = colorspace::heat_hcl(7))
+```
+
+
+Met deze kleurenschemawijziging kun je duidelijk zien dat er door de jaren heen een sterke stijging is in de prijs per pond honing. Als je een steekproef uit de data neemt om dit te controleren (bijvoorbeeld Arizona), zie je een patroon van prijsstijgingen per jaar, met enkele uitzonderingen:
+
+| staat | numcol | yieldpercol | totalprod | stocks | priceperlb | prodvalue | jaar |
+| ----- | ------ | ----------- | --------- | ------- | ---------- | --------- | ---- |
+| AZ | 55000 | 60 | 3300000 | 1485000 | 0.64 | 2112000 | 1998 |
+| AZ | 52000 | 62 | 3224000 | 1548000 | 0.62 | 1999000 | 1999 |
+| AZ | 40000 | 59 | 2360000 | 1322000 | 0.73 | 1723000 | 2000 |
+| AZ | 43000 | 59 | 2537000 | 1142000 | 0.72 | 1827000 | 2001 |
+| AZ | 38000 | 63 | 2394000 | 1197000 | 1.08 | 2586000 | 2002 |
+| AZ | 35000 | 72 | 2520000 | 983000 | 1.34 | 3377000 | 2003 |
+| AZ | 32000 | 55 | 1760000 | 774000 | 1.11 | 1954000 | 2004 |
+| AZ | 36000 | 50 | 1800000 | 720000 | 1.04 | 1872000 | 2005 |
+| AZ | 30000 | 65 | 1950000 | 839000 | 0.91 | 1775000 | 2006 |
+| AZ | 30000 | 64 | 1920000 | 902000 | 1.26 | 2419000 | 2007 |
+| AZ | 25000 | 64 | 1600000 | 336000 | 1.26 | 2016000 | 2008 |
+| AZ | 20000 | 52 | 1040000 | 562000 | 1.45 | 1508000 | 2009 |
+| AZ | 24000 | 77 | 1848000 | 665000 | 1.52 | 2809000 | 2010 |
+| AZ | 23000 | 53 | 1219000 | 427000 | 1.55 | 1889000 | 2011 |
+| AZ | 22000 | 46 | 1012000 | 253000 | 1.79 | 1811000 | 2012 |
+
+Een andere manier om deze ontwikkeling te visualiseren is door grootte in plaats van kleur te gebruiken. Voor kleurenblinde gebruikers kan dit een betere optie zijn. Pas je visualisatie aan om een prijsstijging te laten zien door een toename in de omtrek van de stippen:
+
+```r
+ggplot(honey, aes(x = priceperlb, y = state)) +
+ geom_point(aes(size = year),colour = "blue") +
+ scale_size_continuous(range = c(0.25, 3))
+```
+Je ziet dat de grootte van de stippen geleidelijk toeneemt.
+
+
+
+Is dit een eenvoudig geval van vraag en aanbod? Door factoren zoals klimaatverandering en het instorten van kolonies is er misschien minder honing beschikbaar, waardoor de prijs jaar na jaar stijgt?
+
+Om een correlatie tussen enkele variabelen in deze dataset te ontdekken, laten we enkele lijndiagrammen verkennen.
+
+## Lijndiagrammen
+
+Vraag: Is er een duidelijke stijging in de prijs van honing per pond door de jaren heen? Dit kun je het gemakkelijkst ontdekken door een enkel lijndiagram te maken:
+
+```r
+qplot(honey$year,honey$priceperlb, geom='smooth', span =0.5, xlab = "year",ylab = "priceperlb")
+```
+Antwoord: Ja, met enkele uitzonderingen rond het jaar 2003:
+
+
+
+Vraag: Kunnen we in 2003 ook een piek in de honingvoorraad zien? Wat als je kijkt naar de totale productie door de jaren heen?
+
+```python
+qplot(honey$year,honey$totalprod, geom='smooth', span =0.5, xlab = "year",ylab = "totalprod")
+```
+
+
+
+Antwoord: Niet echt. Als je kijkt naar de totale productie, lijkt deze in dat specifieke jaar zelfs te zijn toegenomen, hoewel de hoeveelheid geproduceerde honing over het algemeen afneemt in deze jaren.
+
+Vraag: Wat zou dan die piek in de honingprijs rond 2003 kunnen hebben veroorzaakt?
+
+Om dit te ontdekken, kun je een facet grid verkennen.
+
+## Facet grids
+
+Facet grids nemen één aspect van je dataset (in ons geval kun je 'jaar' kiezen om te voorkomen dat er te veel facetten worden geproduceerd). Seaborn kan dan een plot maken voor elk van die facetten van je gekozen x- en y-coördinaten voor een eenvoudigere visuele vergelijking. Valt 2003 op in dit soort vergelijking?
+
+Maak een facet grid door gebruik te maken van `facet_wrap`, zoals aanbevolen door de [ggplot2-documentatie](https://ggplot2.tidyverse.org/reference/facet_wrap.html).
+
+```r
+ggplot(honey, aes(x=yieldpercol, y = numcol,group = 1)) +
+ geom_line() + facet_wrap(vars(year))
+```
+In deze visualisatie kun je de opbrengst per kolonie en het aantal kolonies door de jaren heen vergelijken, naast elkaar met een wrap ingesteld op 3 kolommen:
+
+
+
+Voor deze dataset valt er niets bijzonders op met betrekking tot het aantal kolonies en hun opbrengst, jaar na jaar en staat na staat. Is er een andere manier om een correlatie tussen deze twee variabelen te vinden?
+
+## Dubbele lijndiagrammen
+
+Probeer een meervoudig lijndiagram door twee lijndiagrammen over elkaar heen te leggen, met behulp van de `par` en `plot` functies van R. We plotten het jaar op de x-as en tonen twee y-assen. Toon de opbrengst per kolonie en het aantal kolonies, over elkaar heen:
+
+```r
+par(mar = c(5, 4, 4, 4) + 0.3)
+plot(honey$year, honey$numcol, pch = 16, col = 2,type="l")
+par(new = TRUE)
+plot(honey$year, honey$yieldpercol, pch = 17, col = 3,
+ axes = FALSE, xlab = "", ylab = "",type="l")
+axis(side = 4, at = pretty(range(y2)))
+mtext("colony yield", side = 4, line = 3)
+```
+
+
+Hoewel er rond 2003 niets opvallends te zien is, eindigen we deze les met een iets positiever noot: hoewel het aantal kolonies over het algemeen afneemt, stabiliseert het aantal kolonies, zelfs als hun opbrengst per kolonie afneemt.
+
+Go, bijen, go!
+
+🐝❤️
+## 🚀 Uitdaging
+
+In deze les heb je meer geleerd over andere toepassingen van scatterplots en lijngrafieken, inclusief facet grids. Daag jezelf uit om een facet grid te maken met een andere dataset, misschien een die je eerder in deze lessen hebt gebruikt. Let op hoe lang het duurt om ze te maken en hoe je voorzichtig moet zijn met het aantal grids dat je tekent met deze technieken.
+## [Quiz na de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/23)
+
+## Herhaling & Zelfstudie
+
+Lijndiagrammen kunnen eenvoudig of behoorlijk complex zijn. Lees wat meer in de [ggplot2-documentatie](https://ggplot2.tidyverse.org/reference/geom_path.html#:~:text=geom_line()%20connects%20them%20in,which%20cases%20are%20connected%20together) over de verschillende manieren waarop je ze kunt bouwen. Probeer de lijndiagrammen die je in deze les hebt gemaakt te verbeteren met andere methoden die in de documentatie worden genoemd.
+## Opdracht
+
+[Duik in de bijenkorf](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/R/13-meaningful-vizualizations/README.md b/translations/nl/3-Data-Visualization/R/13-meaningful-vizualizations/README.md
new file mode 100644
index 00000000..5f948816
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/R/13-meaningful-vizualizations/README.md
@@ -0,0 +1,182 @@
+
+# Betekenisvolle Visualisaties Maken
+
+| ](../../../sketchnotes/13-MeaningfulViz.png)|
+|:---:|
+| Betekenisvolle Visualisaties - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+> "Als je de data lang genoeg martelt, zal het alles bekennen" -- [Ronald Coase](https://en.wikiquote.org/wiki/Ronald_Coase)
+
+Een van de basisvaardigheden van een datawetenschapper is het vermogen om een betekenisvolle datavisualisatie te maken die helpt vragen te beantwoorden. Voordat je je data visualiseert, moet je ervoor zorgen dat deze is opgeschoond en voorbereid, zoals je in eerdere lessen hebt gedaan. Daarna kun je beginnen met beslissen hoe je de data het beste kunt presenteren.
+
+In deze les leer je:
+
+1. Hoe je het juiste type grafiek kiest
+2. Hoe je misleidende grafieken vermijdt
+3. Hoe je met kleur werkt
+4. Hoe je je grafieken stijlvol en leesbaar maakt
+5. Hoe je geanimeerde of 3D-grafieken maakt
+6. Hoe je een creatieve visualisatie bouwt
+
+## [Pre-Les Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/24)
+
+## Kies het juiste type grafiek
+
+In eerdere lessen heb je geëxperimenteerd met het maken van allerlei interessante datavisualisaties met behulp van Matplotlib en Seaborn. Over het algemeen kun je het [juiste type grafiek](https://chartio.com/learn/charts/how-to-select-a-data-vizualization/) kiezen voor de vraag die je stelt met behulp van deze tabel:
+
+| Wat je wilt doen: | Je zou moeten gebruiken: |
+| -------------------------- | ------------------------------- |
+| Trends in data over tijd tonen | Lijn |
+| Categorieën vergelijken | Staaf, Taart |
+| Totalen vergelijken | Taart, Gestapelde Staaf |
+| Relaties tonen | Spreiding, Lijn, Facet, Dubbele Lijn |
+| Verdelingen tonen | Spreiding, Histogram, Box |
+| Verhoudingen tonen | Taart, Donut, Wafel |
+
+> ✅ Afhankelijk van de samenstelling van je data, moet je deze mogelijk omzetten van tekst naar numeriek om een bepaalde grafiek te ondersteunen.
+
+## Vermijd misleiding
+
+Zelfs als een datawetenschapper zorgvuldig het juiste type grafiek kiest, zijn er genoeg manieren waarop data kan worden weergegeven om een punt te bewijzen, vaak ten koste van de integriteit van de data. Er zijn veel voorbeelden van misleidende grafieken en infographics!
+
+[](https://www.youtube.com/watch?v=oX74Nge8Wkw "How charts lie")
+
+> 🎥 Klik op de afbeelding hierboven voor een conferentietoespraak over misleidende grafieken
+
+Deze grafiek keert de X-as om om het tegenovergestelde van de waarheid te tonen, gebaseerd op de datum:
+
+
+
+[Deze grafiek](https://media.firstcoastnews.com/assets/WTLV/images/170ae16f-4643-438f-b689-50d66ca6a8d8/170ae16f-4643-438f-b689-50d66ca6a8d8_1140x641.jpg) is nog misleidender, omdat het oog naar rechts wordt getrokken om te concluderen dat COVID-gevallen in de loop van de tijd zijn afgenomen in verschillende provincies. Als je echter goed naar de data kijkt, zie je dat de datums zijn herschikt om die misleidende dalende trend te creëren.
+
+
+
+Dit beruchte voorbeeld gebruikt kleur EN een omgekeerde Y-as om te misleiden: in plaats van te concluderen dat het aantal schietincidenten steeg na de invoering van gun-vriendelijke wetgeving, wordt het oog misleid om te denken dat het tegenovergestelde waar is:
+
+
+
+Deze vreemde grafiek laat zien hoe verhoudingen kunnen worden gemanipuleerd, met hilarisch effect:
+
+
+
+Het vergelijken van onvergelijkbare zaken is nog een schimmige truc. Er is een [geweldige website](https://tylervigen.com/spurious-correlations) over 'spurious correlations' die 'feiten' toont zoals de correlatie tussen het echtscheidingspercentage in Maine en de consumptie van margarine. Een Reddit-groep verzamelt ook de [lelijke toepassingen](https://www.reddit.com/r/dataisugly/top/?t=all) van data.
+
+Het is belangrijk om te begrijpen hoe gemakkelijk het oog kan worden misleid door misleidende grafieken. Zelfs als de intentie van de datawetenschapper goed is, kan de keuze voor een slecht type grafiek, zoals een taartdiagram met te veel categorieën, misleidend zijn.
+
+## Kleur
+
+Je zag in de 'Florida gun violence'-grafiek hierboven hoe kleur een extra laag betekenis kan toevoegen aan grafieken, vooral aan grafieken die niet zijn ontworpen met bibliotheken zoals ggplot2 en RColorBrewer, die verschillende goedgekeurde kleurenbibliotheken en -paletten bevatten. Als je een grafiek met de hand maakt, doe dan wat onderzoek naar [kleurentheorie](https://colormatters.com/color-and-design/basic-color-theory).
+
+> ✅ Houd er rekening mee dat toegankelijkheid een belangrijk aspect is van visualisatie. Sommige gebruikers kunnen kleurenblind zijn - wordt je grafiek goed weergegeven voor gebruikers met visuele beperkingen?
+
+Wees voorzichtig bij het kiezen van kleuren voor je grafiek, omdat kleur een betekenis kan overbrengen die je misschien niet bedoelt. De 'roze dames' in de 'lengte'-grafiek hierboven geven een duidelijk 'vrouwelijke' betekenis die bijdraagt aan de absurditeit van de grafiek zelf.
+
+Hoewel [kleurbetekenis](https://colormatters.com/color-symbolism/the-meanings-of-colors) kan verschillen in verschillende delen van de wereld en de betekenis kan veranderen afhankelijk van de tint, omvatten algemene kleurbetekenissen:
+
+| Kleur | Betekenis |
+| ------- | -------------------- |
+| rood | kracht |
+| blauw | vertrouwen, loyaliteit |
+| geel | geluk, voorzichtigheid |
+| groen | ecologie, geluk, jaloezie |
+| paars | geluk |
+| oranje | levendigheid |
+
+Als je de taak hebt om een grafiek met aangepaste kleuren te maken, zorg er dan voor dat je grafieken zowel toegankelijk zijn als dat de kleur die je kiest overeenkomt met de betekenis die je wilt overbrengen.
+
+## Stijl je grafieken voor leesbaarheid
+
+Grafieken zijn niet betekenisvol als ze niet leesbaar zijn! Neem even de tijd om de breedte en hoogte van je grafiek te overwegen, zodat deze goed schaalt met je data. Als een variabele (zoals alle 50 staten) moet worden weergegeven, toon ze dan verticaal op de Y-as als dat mogelijk is, om een horizontaal scrollende grafiek te vermijden.
+
+Label je assen, geef een legenda indien nodig, en bied tooltips aan voor een beter begrip van de data.
+
+Als je data tekstueel en uitgebreid is op de X-as, kun je de tekst schuin zetten voor betere leesbaarheid. [plot3D](https://cran.r-project.org/web/packages/plot3D/index.html) biedt 3D-plotmogelijkheden als je data dit ondersteunt. Geavanceerde datavisualisaties kunnen hiermee worden gemaakt.
+
+
+
+## Animatie en 3D-grafiekweergave
+
+Sommige van de beste datavisualisaties van vandaag zijn geanimeerd. Shirley Wu heeft geweldige voorbeelden gemaakt met D3, zoals '[film flowers](http://bl.ocks.org/sxywu/raw/d612c6c653fb8b4d7ff3d422be164a5d/)', waarbij elke bloem een visualisatie van een film is. Een ander voorbeeld voor de Guardian is 'bussed out', een interactieve ervaring die visualisaties combineert met Greensock en D3, plus een scrollytelling-artikelformaat om te laten zien hoe NYC omgaat met zijn daklozenprobleem door mensen de stad uit te sturen.
+
+
+
+> "Bussed Out: How America Moves its Homeless" van [the Guardian](https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study). Visualisaties door Nadieh Bremer & Shirley Wu
+
+Hoewel deze les niet diepgaand genoeg is om deze krachtige visualisatiebibliotheken te leren, kun je experimenteren met D3 in een Vue.js-app door een bibliotheek te gebruiken om een visualisatie van het boek "Dangerous Liaisons" als een geanimeerd sociaal netwerk weer te geven.
+
+> "Les Liaisons Dangereuses" is een briefroman, of een roman gepresenteerd als een reeks brieven. Geschreven in 1782 door Choderlos de Laclos, vertelt het het verhaal van de wrede, moreel failliete sociale manoeuvres van twee rivaliserende protagonisten van de Franse aristocratie in de late 18e eeuw, de Vicomte de Valmont en de Marquise de Merteuil. Beiden komen uiteindelijk aan hun einde, maar niet zonder aanzienlijke sociale schade aan te richten. De roman ontvouwt zich als een reeks brieven geschreven aan verschillende mensen in hun kringen, met plannen voor wraak of simpelweg om problemen te veroorzaken. Maak een visualisatie van deze brieven om de belangrijkste spelers in het verhaal visueel te ontdekken.
+
+Je voltooit een webapp die een geanimeerd overzicht van dit sociale netwerk weergeeft. Het gebruikt een bibliotheek die is gebouwd om een [visualisatie van een netwerk](https://github.com/emiliorizzo/vue-d3-network) te maken met Vue.js en D3. Wanneer de app draait, kun je de knooppunten op het scherm verplaatsen om de data te herschikken.
+
+
+
+## Project: Bouw een grafiek om een netwerk te tonen met D3.js
+
+> Deze lesmap bevat een `solution`-map waar je het voltooide project kunt vinden ter referentie.
+
+1. Volg de instructies in het README.md-bestand in de root van de startermap. Zorg ervoor dat je NPM en Node.js op je computer hebt draaien voordat je de afhankelijkheden van je project installeert.
+
+2. Open de map `starter/src`. Je vindt een `assets`-map met daarin een .json-bestand met alle brieven uit de roman, genummerd, met een 'to' en 'from'-annotatie.
+
+3. Voltooi de code in `components/Nodes.vue` om de visualisatie mogelijk te maken. Zoek naar de methode genaamd `createLinks()` en voeg de volgende geneste lus toe.
+
+Loop door het .json-object om de 'to'- en 'from'-data voor de brieven vast te leggen en bouw het `links`-object op zodat de visualisatiebibliotheek het kan gebruiken:
+
+```javascript
+//loop through letters
+ let f = 0;
+ let t = 0;
+ for (var i = 0; i < letters.length; i++) {
+ for (var j = 0; j < characters.length; j++) {
+
+ if (characters[j] == letters[i].from) {
+ f = j;
+ }
+ if (characters[j] == letters[i].to) {
+ t = j;
+ }
+ }
+ this.links.push({ sid: f, tid: t });
+ }
+ ```
+
+Voer je app uit vanuit de terminal (npm run serve) en geniet van de visualisatie!
+
+## 🚀 Uitdaging
+
+Maak een rondje over het internet om misleidende visualisaties te ontdekken. Hoe misleidt de auteur de gebruiker, en is dit opzettelijk? Probeer de visualisaties te corrigeren om te laten zien hoe ze eruit zouden moeten zien.
+
+## [Post-les Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/25)
+
+## Herziening & Zelfstudie
+
+Hier zijn enkele artikelen om te lezen over misleidende datavisualisatie:
+
+https://gizmodo.com/how-to-lie-with-data-visualization-1563576606
+
+http://ixd.prattsi.org/2017/12/visual-lies-usability-in-deceptive-data-visualizations/
+
+Bekijk deze interessante visualisaties van historische objecten en artefacten:
+
+https://handbook.pubpub.org/
+
+Lees dit artikel over hoe animatie je visualisaties kan verbeteren:
+
+https://medium.com/@EvanSinar/use-animation-to-supercharge-data-visualization-cd905a882ad4
+
+## Opdracht
+
+[Bouw je eigen aangepaste visualisatie](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/3-Data-Visualization/README.md b/translations/nl/3-Data-Visualization/README.md
new file mode 100644
index 00000000..20eac188
--- /dev/null
+++ b/translations/nl/3-Data-Visualization/README.md
@@ -0,0 +1,42 @@
+
+# Visualisaties
+
+
+> Foto door Jenna Lee op Unsplash
+
+Het visualiseren van data is een van de belangrijkste taken van een datawetenschapper. Beelden zeggen meer dan duizend woorden, en een visualisatie kan je helpen allerlei interessante aspecten van je data te identificeren, zoals pieken, uitschieters, groeperingen, tendensen en meer, die je kunnen helpen het verhaal van je data te begrijpen.
+
+In deze vijf lessen ga je data uit de natuur verkennen en interessante en mooie visualisaties maken met behulp van verschillende technieken.
+
+| Onderwerp Nummer | Onderwerp | Gelinkte Les | Auteur |
+| :--------------: | :-------: | :----------: | :----: |
+| 1. | Hoeveelheden visualiseren | - [Python](09-visualization-quantities/README.md)
- [R](../../../3-Data-Visualization/R/09-visualization-quantities)
| - [Jen Looper](https://twitter.com/jenlooper)
- [Vidushi Gupta](https://github.com/Vidushi-Gupta)
- [Jasleen Sondhi](https://github.com/jasleen101010)
|
+| 2. | Distributie visualiseren | - [Python](10-visualization-distributions/README.md)
- [R](../../../3-Data-Visualization/R/10-visualization-distributions)
| - [Jen Looper](https://twitter.com/jenlooper)
- [Vidushi Gupta](https://github.com/Vidushi-Gupta)
- [Jasleen Sondhi](https://github.com/jasleen101010)
|
+| 3. | Verhoudingen visualiseren | - [Python](11-visualization-proportions/README.md)
- [R](../../../3-Data-Visualization)
| - [Jen Looper](https://twitter.com/jenlooper)
- [Vidushi Gupta](https://github.com/Vidushi-Gupta)
- [Jasleen Sondhi](https://github.com/jasleen101010)
|
+| 4. | Relaties visualiseren | - [Python](12-visualization-relationships/README.md)
- [R](../../../3-Data-Visualization)
| - [Jen Looper](https://twitter.com/jenlooper)
- [Vidushi Gupta](https://github.com/Vidushi-Gupta)
- [Jasleen Sondhi](https://github.com/jasleen101010)
|
+| 5. | Betekenisvolle visualisaties maken | - [Python](13-meaningful-visualizations/README.md)
- [R](../../../3-Data-Visualization)
| - [Jen Looper](https://twitter.com/jenlooper)
- [Vidushi Gupta](https://github.com/Vidushi-Gupta)
- [Jasleen Sondhi](https://github.com/jasleen101010)
|
+
+### Credits
+
+Deze visualisatielessen zijn geschreven met 🌸 door [Jen Looper](https://twitter.com/jenlooper), [Jasleen Sondhi](https://github.com/jasleen101010) en [Vidushi Gupta](https://github.com/Vidushi-Gupta).
+
+🍯 Data over de honingproductie in de VS is afkomstig van Jessica Li's project op [Kaggle](https://www.kaggle.com/jessicali9530/honey-production). De [data](https://usda.library.cornell.edu/concern/publications/rn301137d) is afgeleid van het [United States Department of Agriculture](https://www.nass.usda.gov/About_NASS/index.php).
+
+🍄 Data over paddenstoelen is ook afkomstig van [Kaggle](https://www.kaggle.com/hatterasdunton/mushroom-classification-updated-dataset), herzien door Hatteras Dunton. Deze dataset bevat beschrijvingen van hypothetische monsters die overeenkomen met 23 soorten plaatjeszwammen in de Agaricus- en Lepiota-familie. Paddenstoelen getekend uit The Audubon Society Field Guide to North American Mushrooms (1981). Deze dataset werd in 1987 gedoneerd aan UCI ML 27.
+
+🦆 Data over vogels in Minnesota is afkomstig van [Kaggle](https://www.kaggle.com/hannahcollins/minnesota-birds), gescraped van [Wikipedia](https://en.wikipedia.org/wiki/List_of_birds_of_Minnesota) door Hannah Collins.
+
+Al deze datasets zijn gelicenseerd als [CC0: Creative Commons](https://creativecommons.org/publicdomain/zero/1.0/).
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/4-Data-Science-Lifecycle/14-Introduction/README.md b/translations/nl/4-Data-Science-Lifecycle/14-Introduction/README.md
new file mode 100644
index 00000000..f985a665
--- /dev/null
+++ b/translations/nl/4-Data-Science-Lifecycle/14-Introduction/README.md
@@ -0,0 +1,123 @@
+
+# Introductie tot de Data Science Levenscyclus
+
+| ](../../sketchnotes/14-DataScience-Lifecycle.png)|
+|:---:|
+| Introductie tot de Data Science Levenscyclus - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+## [Pre-Les Quiz](https://red-water-0103e7a0f.azurestaticapps.net/quiz/26)
+
+Op dit punt heb je waarschijnlijk al door dat data science een proces is. Dit proces kan worden opgedeeld in 5 fasen:
+
+- Vastleggen
+- Verwerken
+- Analyseren
+- Communiceren
+- Onderhouden
+
+Deze les richt zich op 3 delen van de levenscyclus: vastleggen, verwerken en onderhouden.
+
+
+> Foto door [Berkeley School of Information](https://ischoolonline.berkeley.edu/data-science/what-is-data-science/)
+
+## Vastleggen
+
+De eerste fase van de levenscyclus is erg belangrijk, omdat de volgende fasen hiervan afhankelijk zijn. Het is eigenlijk twee fasen gecombineerd in één: het verkrijgen van de data en het definiëren van het doel en de problemen die moeten worden aangepakt.
+Het definiëren van de doelen van het project vereist een diepere context van het probleem of de vraag. Eerst moeten we degenen identificeren en betrekken die hun probleem opgelost willen hebben. Dit kunnen belanghebbenden in een bedrijf zijn of sponsors van het project, die kunnen helpen bepalen wie of wat baat heeft bij dit project, evenals wat en waarom ze het nodig hebben. Een goed gedefinieerd doel moet meetbaar en kwantificeerbaar zijn om een acceptabel resultaat te definiëren.
+
+Vragen die een data scientist kan stellen:
+- Is dit probleem eerder aangepakt? Wat is er ontdekt?
+- Begrijpt iedereen het doel en de bedoeling?
+- Is er sprake van onduidelijkheid en hoe kan dit worden verminderd?
+- Wat zijn de beperkingen?
+- Hoe zou het eindresultaat er mogelijk uitzien?
+- Hoeveel middelen (tijd, mensen, rekenkracht) zijn beschikbaar?
+
+Vervolgens moeten we de benodigde data identificeren, verzamelen en uiteindelijk verkennen om deze gedefinieerde doelen te bereiken. In deze stap van acquisitie moeten data scientists ook de hoeveelheid en kwaliteit van de data evalueren. Dit vereist enige data-exploratie om te bevestigen dat wat is verzameld, zal bijdragen aan het bereiken van het gewenste resultaat.
+
+Vragen die een data scientist kan stellen over de data:
+- Welke data is al beschikbaar voor mij?
+- Wie is eigenaar van deze data?
+- Wat zijn de privacykwesties?
+- Heb ik genoeg om dit probleem op te lossen?
+- Is de kwaliteit van de data acceptabel voor dit probleem?
+- Als ik aanvullende informatie ontdek via deze data, moeten we dan overwegen de doelen te wijzigen of opnieuw te definiëren?
+
+## Verwerken
+
+De verwerkingsfase van de levenscyclus richt zich op het ontdekken van patronen in de data en het modelleren. Sommige technieken die in deze fase worden gebruikt, vereisen statistische methoden om de patronen te onthullen. Dit zou doorgaans een tijdrovende taak zijn voor een mens met een grote dataset, en daarom wordt er vaak op computers vertrouwd om het zware werk te doen en het proces te versnellen. Deze fase is ook waar data science en machine learning elkaar kruisen. Zoals je in de eerste les hebt geleerd, is machine learning het proces van het bouwen van modellen om de data te begrijpen. Modellen zijn een representatie van de relatie tussen variabelen in de data die helpen om uitkomsten te voorspellen.
+
+Veelgebruikte technieken in deze fase worden behandeld in het curriculum van ML voor Beginners. Volg de links om meer over deze technieken te leren:
+
+- [Classificatie](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification): Het organiseren van data in categorieën voor efficiënter gebruik.
+- [Clustering](https://github.com/microsoft/ML-For-Beginners/tree/main/5-Clustering): Het groeperen van data in vergelijkbare groepen.
+- [Regressie](https://github.com/microsoft/ML-For-Beginners/tree/main/2-Regression): Het bepalen van de relaties tussen variabelen om waarden te voorspellen of te schatten.
+
+## Onderhouden
+
+In het diagram van de levenscyclus heb je misschien opgemerkt dat onderhoud zich bevindt tussen vastleggen en verwerken. Onderhoud is een doorlopend proces van het beheren, opslaan en beveiligen van de data gedurende het hele project en moet gedurende het hele project in overweging worden genomen.
+
+### Data Opslaan
+
+Overwegingen over hoe en waar de data wordt opgeslagen, kunnen invloed hebben op de kosten van opslag en de prestaties van hoe snel de data kan worden benaderd. Beslissingen zoals deze worden waarschijnlijk niet alleen door een data scientist genomen, maar zij kunnen wel keuzes maken over hoe ze met de data werken op basis van hoe deze is opgeslagen.
+
+Hier zijn enkele aspecten van moderne datasystemen die deze keuzes kunnen beïnvloeden:
+
+**On-premise vs off-premise vs publieke of private cloud**
+
+On-premise verwijst naar het zelf hosten en beheren van de data op je eigen apparatuur, zoals een server met harde schijven die de data opslaan, terwijl off-premise vertrouwt op apparatuur die je niet bezit, zoals een datacenter. De publieke cloud is een populaire keuze voor het opslaan van data die geen kennis vereist van hoe of waar precies de data wordt opgeslagen. Publiek verwijst naar een gedeelde onderliggende infrastructuur die door iedereen die de cloud gebruikt wordt gedeeld. Sommige organisaties hebben strikte beveiligingsbeleid die vereisen dat ze volledige toegang hebben tot de apparatuur waar de data wordt gehost en vertrouwen op een private cloud die eigen clouddiensten biedt. Je leert meer over data in de cloud in [latere lessen](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/5-Data-Science-In-Cloud).
+
+**Koude vs warme data**
+
+Bij het trainen van je modellen heb je mogelijk meer trainingsdata nodig. Als je tevreden bent met je model, zal er meer data binnenkomen om het model zijn doel te laten dienen. In elk geval zullen de kosten van het opslaan en benaderen van data toenemen naarmate je meer data verzamelt. Het scheiden van zelden gebruikte data, bekend als koude data, van vaak benaderde warme data kan een goedkopere opslagoptie zijn via hardware of softwarediensten. Als koude data moet worden benaderd, kan het iets langer duren om deze op te halen in vergelijking met warme data.
+
+### Data Beheren
+
+Tijdens het werken met data kun je ontdekken dat sommige data moet worden opgeschoond met behulp van technieken die worden behandeld in de les over [data voorbereiding](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/2-Working-With-Data/08-data-preparation) om nauwkeurige modellen te bouwen. Wanneer nieuwe data binnenkomt, zal het dezelfde toepassingen nodig hebben om consistentie in kwaliteit te behouden. Sommige projecten maken gebruik van een geautomatiseerd hulpmiddel voor het opschonen, aggregeren en comprimeren voordat de data naar de uiteindelijke locatie wordt verplaatst. Azure Data Factory is een voorbeeld van een van deze tools.
+
+### Data Beveiligen
+
+Een van de belangrijkste doelen van het beveiligen van data is ervoor zorgen dat degenen die ermee werken, controle hebben over wat wordt verzameld en in welke context het wordt gebruikt. Het beveiligen van data omvat het beperken van toegang tot alleen degenen die het nodig hebben, het naleven van lokale wetten en regelgeving, evenals het handhaven van ethische normen, zoals behandeld in de [ethiekles](https://github.com/microsoft/Data-Science-For-Beginners/tree/main/1-Introduction/02-ethics).
+
+Hier zijn enkele dingen die een team kan doen met beveiliging in gedachten:
+- Bevestigen dat alle data is versleuteld
+- Klanten informeren over hoe hun data wordt gebruikt
+- Toegang tot data verwijderen voor degenen die het project hebben verlaten
+- Alleen bepaalde projectleden toestaan om de data te wijzigen
+
+## 🚀 Uitdaging
+
+Er zijn veel versies van de Data Science Levenscyclus, waarbij elke stap verschillende namen en aantallen fasen kan hebben, maar dezelfde processen bevat die in deze les worden genoemd.
+
+Verken de [Team Data Science Process levenscyclus](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/lifecycle) en de [Cross-industry standard process for data mining](https://www.datascience-pm.com/crisp-dm-2/). Noem 3 overeenkomsten en verschillen tussen de twee.
+
+|Team Data Science Process (TDSP)|Cross-industry standard process for data mining (CRISP-DM)|
+|--|--|
+| |  |
+| Afbeelding door [Microsoft](https://docs.microsoft.comazure/architecture/data-science-process/lifecycle) | Afbeelding door [Data Science Process Alliance](https://www.datascience-pm.com/crisp-dm-2/) |
+
+## [Post-Les Quiz](https://red-water-0103e7a0f.azurestaticapps.net/quiz/27)
+
+## Herziening & Zelfstudie
+
+Het toepassen van de Data Science Levenscyclus omvat meerdere rollen en taken, waarbij sommigen zich richten op specifieke delen van elke fase. Het Team Data Science Process biedt enkele bronnen die de soorten rollen en taken uitleggen die iemand in een project kan hebben.
+
+* [Team Data Science Process rollen en taken](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/roles-tasks)
+* [Uitvoeren van data science taken: exploratie, modellering en implementatie](https://docs.microsoft.com/en-us/azure/architecture/data-science-process/execute-data-science-tasks)
+
+## Opdracht
+
+[Een Dataset Beoordelen](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/4-Data-Science-Lifecycle/14-Introduction/assignment.md b/translations/nl/4-Data-Science-Lifecycle/14-Introduction/assignment.md
new file mode 100644
index 00000000..c6b85efb
--- /dev/null
+++ b/translations/nl/4-Data-Science-Lifecycle/14-Introduction/assignment.md
@@ -0,0 +1,37 @@
+
+# Het beoordelen van een dataset
+
+Een klant heeft jouw team benaderd om te helpen bij het onderzoeken van de seizoensgebonden uitgavenpatronen van taxiklanten in New York City.
+
+Ze willen weten: **Geven passagiers van gele taxi's in New York City meer fooi aan chauffeurs in de winter of in de zomer?**
+
+Jouw team bevindt zich in de [Capturing](Readme.md#Capturing) fase van de Data Science Lifecycle en jij bent verantwoordelijk voor het beheren van de dataset. Je hebt een notebook en [data](../../../../data/taxi.csv) gekregen om te verkennen.
+
+In deze map bevindt zich een [notebook](notebook.ipynb) dat gebruikmaakt van Python om gegevens van gele taxiritten te laden van de [NYC Taxi & Limousine Commission](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets).
+Je kunt het taxibestand ook openen in een teksteditor of spreadsheetsoftware zoals Excel.
+
+## Instructies
+
+- Beoordeel of de gegevens in deze dataset kunnen helpen om de vraag te beantwoorden.
+- Verken de [NYC Open Data catalogus](https://data.cityofnewyork.us/browse?sortBy=most_accessed&utf8=%E2%9C%93). Identificeer een aanvullende dataset die mogelijk nuttig kan zijn om de vraag van de klant te beantwoorden.
+- Stel 3 vragen die je aan de klant zou stellen voor meer verduidelijking en een beter begrip van het probleem.
+
+Raadpleeg het [woordenboek van de dataset](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) en de [gebruikershandleiding](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) voor meer informatie over de gegevens.
+
+## Rubriek
+
+Uitmuntend | Voldoende | Verbetering nodig
+--- | --- | ---
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/4-Data-Science-Lifecycle/15-analyzing/README.md b/translations/nl/4-Data-Science-Lifecycle/15-analyzing/README.md
new file mode 100644
index 00000000..e974d66f
--- /dev/null
+++ b/translations/nl/4-Data-Science-Lifecycle/15-analyzing/README.md
@@ -0,0 +1,61 @@
+
+# De levenscyclus van Data Science: Analyseren
+
+| ](../../sketchnotes/15-Analyzing.png)|
+|:---:|
+| Levenscyclus van Data Science: Analyseren - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+## Quiz voorafgaand aan de les
+
+## [Quiz voorafgaand aan de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/28)
+
+Het analyseren in de levenscyclus van data bevestigt dat de data de gestelde vragen kan beantwoorden of een specifiek probleem kan oplossen. Deze stap richt zich ook op het bevestigen dat een model deze vragen en problemen correct aanpakt. Deze les richt zich op Exploratory Data Analysis (EDA), technieken om kenmerken en relaties binnen de data te definiëren en de data voor te bereiden op modellering.
+
+We gebruiken een voorbeelddataset van [Kaggle](https://www.kaggle.com/balaka18/email-spam-classification-dataset-csv/version/1) om te laten zien hoe dit kan worden toegepast met Python en de Pandas-bibliotheek. Deze dataset bevat een telling van enkele veelvoorkomende woorden in e-mails, waarbij de bronnen van deze e-mails anoniem zijn. Gebruik het [notebook](notebook.ipynb) in deze map om mee te volgen.
+
+## Exploratory Data Analysis
+
+De fase van het verzamelen in de levenscyclus is waar de data wordt verkregen, evenals de problemen en vragen die moeten worden beantwoord. Maar hoe weten we of de data kan bijdragen aan het eindresultaat?
+Herinner je dat een datawetenschapper de volgende vragen kan stellen bij het verkrijgen van data:
+- Heb ik genoeg data om dit probleem op te lossen?
+- Is de kwaliteit van de data acceptabel voor dit probleem?
+- Als ik aanvullende informatie ontdek via deze data, moeten we dan overwegen de doelen te wijzigen of opnieuw te definiëren?
+
+Exploratory Data Analysis is het proces van het leren kennen van de data en kan worden gebruikt om deze vragen te beantwoorden, evenals om de uitdagingen van het werken met de dataset te identificeren. Laten we ons richten op enkele technieken die hiervoor worden gebruikt.
+
+## Data profileren, beschrijvende statistieken en Pandas
+Hoe beoordelen we of we genoeg data hebben om dit probleem op te lossen? Data profileren kan een samenvatting geven en algemene informatie over onze dataset verzamelen via technieken van beschrijvende statistieken. Data profileren helpt ons te begrijpen wat beschikbaar is, en beschrijvende statistieken helpen ons te begrijpen hoeveel er beschikbaar is.
+
+In enkele van de vorige lessen hebben we Pandas gebruikt om beschrijvende statistieken te leveren met de [`describe()`-functie](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html). Deze functie geeft de telling, maximale en minimale waarden, gemiddelde, standaarddeviatie en kwantielen van de numerieke data. Het gebruik van beschrijvende statistieken zoals de `describe()`-functie kan je helpen te beoordelen hoeveel je hebt en of je meer nodig hebt.
+
+## Steekproeven nemen en query's uitvoeren
+Het volledig verkennen van een grote dataset kan erg tijdrovend zijn en is meestal een taak die aan een computer wordt overgelaten. Steekproeven nemen is echter een nuttig hulpmiddel om inzicht te krijgen in de data en stelt ons in staat beter te begrijpen wat er in de dataset zit en wat het vertegenwoordigt. Met een steekproef kun je waarschijnlijkheid en statistiek toepassen om tot algemene conclusies over je data te komen. Hoewel er geen vaste regel is over hoeveel data je moet bemonsteren, is het belangrijk op te merken dat hoe meer data je bemonstert, hoe nauwkeuriger je generalisaties over de data kunnen zijn.
+
+Pandas heeft de [`sample()`-functie in zijn bibliotheek](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sample.html), waarmee je een argument kunt doorgeven van hoeveel willekeurige steekproeven je wilt ontvangen en gebruiken.
+
+Algemene query's op de data kunnen je helpen enkele algemene vragen en theorieën te beantwoorden die je hebt. In tegenstelling tot steekproeven stellen query's je in staat controle te hebben en je te richten op specifieke delen van de data waar je vragen over hebt. De [`query()`-functie](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.query.html) in de Pandas-bibliotheek stelt je in staat kolommen te selecteren en eenvoudige antwoorden te krijgen over de data via de opgehaalde rijen.
+
+## Verkennen met visualisaties
+Je hoeft niet te wachten tot de data volledig is opgeschoond en geanalyseerd om visualisaties te maken. Sterker nog, het hebben van een visuele weergave tijdens het verkennen kan helpen patronen, relaties en problemen in de data te identificeren. Bovendien bieden visualisaties een communicatiemiddel met degenen die niet betrokken zijn bij het beheren van de data en kunnen ze een kans zijn om aanvullende vragen te delen en te verduidelijken die niet in de verzamelingsfase zijn behandeld. Raadpleeg de [sectie over visualisaties](../../../../../../../../../3-Data-Visualization) om meer te leren over enkele populaire manieren om visueel te verkennen.
+
+## Verkennen om inconsistenties te identificeren
+Alle onderwerpen in deze les kunnen helpen ontbrekende of inconsistente waarden te identificeren, maar Pandas biedt functies om enkele hiervan te controleren. [isna() of isnull()](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.isna.html) kunnen controleren op ontbrekende waarden. Een belangrijk onderdeel van het onderzoeken van deze waarden in je data is om te onderzoeken waarom ze überhaupt op die manier zijn ontstaan. Dit kan je helpen beslissen welke [acties je moet ondernemen om ze op te lossen](/2-Working-With-Data/08-data-preparation/notebook.ipynb).
+
+## [Quiz voorafgaand aan de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/27)
+
+## Opdracht
+
+[Verkennen voor antwoorden](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/4-Data-Science-Lifecycle/15-analyzing/assignment.md b/translations/nl/4-Data-Science-Lifecycle/15-analyzing/assignment.md
new file mode 100644
index 00000000..4303f360
--- /dev/null
+++ b/translations/nl/4-Data-Science-Lifecycle/15-analyzing/assignment.md
@@ -0,0 +1,36 @@
+
+# Antwoorden verkennen
+
+Dit is een vervolg op de [opdracht](../14-Introduction/assignment.md) van de vorige les, waarin we kort naar de dataset hebben gekeken. Nu gaan we dieper in op de gegevens.
+
+Nogmaals, de vraag die de klant wil weten: **Geven passagiers van gele taxi's in New York City chauffeurs meer fooi in de winter of zomer?**
+
+Jouw team bevindt zich in de [Analyzing](README.md) fase van de Data Science Lifecycle, waarin je verantwoordelijk bent voor het uitvoeren van verkennende data-analyse op de dataset. Je hebt een notebook en dataset ontvangen met 200 taxitransacties uit januari en juli 2019.
+
+## Instructies
+
+In deze map vind je een [notebook](assignment.ipynb) en gegevens van de [Taxi & Limousine Commission](https://docs.microsoft.com/en-us/azure/open-datasets/dataset-taxi-yellow?tabs=azureml-opendatasets). Raadpleeg het [woordenboek van de dataset](https://www1.nyc.gov/assets/tlc/downloads/pdf/data_dictionary_trip_records_yellow.pdf) en de [gebruikershandleiding](https://www1.nyc.gov/assets/tlc/downloads/pdf/trip_record_user_guide.pdf) voor meer informatie over de gegevens.
+
+Gebruik enkele technieken uit deze les om je eigen EDA uit te voeren in het notebook (voeg indien nodig cellen toe) en beantwoord de volgende vragen:
+
+- Welke andere invloeden in de gegevens kunnen het fooibedrag beïnvloeden?
+- Welke kolommen zullen waarschijnlijk niet nodig zijn om de vraag van de klant te beantwoorden?
+- Op basis van wat tot nu toe is verstrekt, lijken de gegevens enig bewijs te leveren van seizoensgebonden fooi-gedrag?
+
+## Rubric
+
+Uitmuntend | Voldoende | Verbetering nodig
+--- | --- | --- |
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/4-Data-Science-Lifecycle/16-communication/README.md b/translations/nl/4-Data-Science-Lifecycle/16-communication/README.md
new file mode 100644
index 00000000..beba785c
--- /dev/null
+++ b/translations/nl/4-Data-Science-Lifecycle/16-communication/README.md
@@ -0,0 +1,222 @@
+
+# De Data Science Levenscyclus: Communicatie
+
+|](../../sketchnotes/16-Communicating.png)|
+|:---:|
+| Data Science Levenscyclus: Communicatie - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+## [Pre-Lecture Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/30)
+
+Test je kennis van wat komen gaat met de Pre-Lecture Quiz hierboven!
+
+# Introductie
+
+### Wat is Communicatie?
+Laten we deze les beginnen met het definiëren van wat communiceren betekent. **Communiceren is het overbrengen of uitwisselen van informatie.** Informatie kan ideeën, gedachten, gevoelens, boodschappen, verborgen signalen, data – alles wat een **_zender_** (iemand die informatie verstuurt) wil dat een **_ontvanger_** (iemand die informatie ontvangt) begrijpt. In deze les zullen we zenders aanduiden als communicators, en ontvangers als het publiek.
+
+### Data Communicatie & Verhalen Vertellen
+We begrijpen dat het doel van communicatie is om informatie over te brengen of uit te wisselen. Maar bij het communiceren van data zou je doel niet simpelweg moeten zijn om cijfers door te geven aan je publiek. Je doel zou moeten zijn om een verhaal te vertellen dat door je data wordt ondersteund – effectieve data communicatie en verhalen vertellen gaan hand in hand. Je publiek zal zich eerder een verhaal herinneren dat je vertelt, dan een cijfer dat je geeft. Later in deze les bespreken we een paar manieren waarop je verhalen kunt gebruiken om je data effectiever te communiceren.
+
+### Soorten Communicatie
+In deze les worden twee verschillende soorten communicatie besproken: eenrichtingscommunicatie en tweerichtingscommunicatie.
+
+**Eenrichtingscommunicatie** vindt plaats wanneer een zender informatie naar een ontvanger stuurt, zonder enige feedback of reactie. We zien voorbeelden van eenrichtingscommunicatie elke dag – in bulk/massamails, wanneer het nieuws de laatste verhalen brengt, of zelfs wanneer een televisiereclame vertelt waarom hun product geweldig is. In elk van deze gevallen zoekt de zender geen uitwisseling van informatie. Ze willen alleen informatie overbrengen of leveren.
+
+**Tweerichtingscommunicatie** vindt plaats wanneer alle betrokken partijen zowel zender als ontvanger zijn. Een zender begint met communiceren naar een ontvanger, en de ontvanger geeft feedback of een reactie. Tweerichtingscommunicatie is wat we traditioneel bedoelen als we het over communicatie hebben. We denken meestal aan mensen die in gesprek zijn – persoonlijk, via een telefoongesprek, sociale media of sms.
+
+Bij het communiceren van data zijn er situaties waarin je eenrichtingscommunicatie gebruikt (denk aan presenteren op een conferentie of aan een grote groep waar direct geen vragen worden gesteld) en situaties waarin je tweerichtingscommunicatie gebruikt (denk aan het overtuigen van een paar belanghebbenden om ergens in te investeren, of een teamgenoot overtuigen om tijd en moeite te steken in het bouwen van iets nieuws).
+
+# Effectieve Communicatie
+
+### Jouw Verantwoordelijkheden als Communicator
+Bij communicatie is het jouw taak om ervoor te zorgen dat je ontvanger(s) de informatie oppikken die jij wilt overbrengen. Bij het communiceren van data wil je niet alleen dat je ontvangers cijfers onthouden, je wilt dat ze een verhaal onthouden dat door je data wordt ondersteund. Een goede data communicator is een goede verhalenverteller.
+
+Hoe vertel je een verhaal met data? Er zijn oneindig veel manieren – maar hieronder staan 6 strategieën die we in deze les bespreken:
+1. Begrijp je publiek, je kanaal en je communicatiemethode
+2. Begin met het einde in gedachten
+3. Benader het als een echt verhaal
+4. Gebruik betekenisvolle woorden en zinnen
+5. Gebruik emotie
+
+Elke van deze strategieën wordt hieronder in meer detail uitgelegd.
+
+### 1. Begrijp je Publiek, je Kanaal & je Communicatiemethode
+De manier waarop je met familieleden communiceert, is waarschijnlijk anders dan hoe je met vrienden communiceert. Je gebruikt waarschijnlijk andere woorden en zinnen die de mensen met wie je spreekt beter begrijpen. Je zou dezelfde aanpak moeten hanteren bij het communiceren van data. Denk na over wie je publiek is. Denk na over hun doelen en de context die ze hebben over de situatie die je uitlegt.
+
+Je kunt je publiek waarschijnlijk groeperen in een categorie. In een artikel van _Harvard Business Review_, “[How to Tell a Story with Data](http://blogs.hbr.org/2013/04/how-to-tell-a-story-with-data/),” identificeert Dell Executive Strategist Jim Stikeleather vijf categorieën van publiek:
+
+- **Novice**: eerste kennismaking met het onderwerp, maar wil geen overdreven simplificatie
+- **Generalist**: bekend met het onderwerp, maar zoekt een overzicht en de belangrijkste thema's
+- **Managerial**: diepgaand, actiegericht begrip van details en onderlinge verbanden met toegang tot details
+- **Expert**: meer gericht op verkenning en ontdekking en minder op verhalen vertellen met veel details
+- **Executive**: heeft alleen tijd om de betekenis en conclusies van gewogen waarschijnlijkheden te begrijpen
+
+Deze categorieën kunnen je helpen bepalen hoe je data aan je publiek presenteert.
+
+Naast het overwegen van de categorie van je publiek, moet je ook nadenken over het kanaal dat je gebruikt om met je publiek te communiceren. Je aanpak moet iets anders zijn als je een memo of e-mail schrijft versus een vergadering hebt of presenteert op een conferentie.
+
+Bovendien is het belangrijk om te weten of je eenrichtingscommunicatie of tweerichtingscommunicatie gebruikt.
+
+Als je communiceert met een voornamelijk Novice-publiek en je gebruikt eenrichtingscommunicatie, moet je eerst je publiek informeren en hen de juiste context geven. Vervolgens moet je je data presenteren en uitleggen wat het betekent en waarom het belangrijk is. In dit geval wil je je richten op helderheid, omdat je publiek je geen directe vragen kan stellen.
+
+Als je communiceert met een voornamelijk Managerial-publiek en je gebruikt tweerichtingscommunicatie, hoef je waarschijnlijk je publiek niet te informeren of veel context te geven. Je kunt waarschijnlijk direct beginnen met het bespreken van de data die je hebt verzameld en waarom het belangrijk is. In dit scenario moet je echter letten op timing en controle over je presentatie. Bij tweerichtingscommunicatie (vooral met een Managerial-publiek dat op zoek is naar een "actiegericht begrip van details en onderlinge verbanden") kunnen er vragen opkomen die de discussie in een richting sturen die niet aansluit bij het verhaal dat je probeert te vertellen. Wanneer dit gebeurt, kun je actie ondernemen om de discussie weer op koers te brengen.
+
+### 2. Begin met het Einde in Gedachten
+Beginnen met het einde in gedachten betekent dat je van tevoren begrijpt wat je wilt dat je publiek meeneemt voordat je begint met communiceren. Door van tevoren na te denken over wat je publiek moet meenemen, kun je een verhaal creëren dat je publiek kan volgen. Dit is geschikt voor zowel eenrichtings- als tweerichtingscommunicatie.
+
+Hoe begin je met het einde in gedachten? Schrijf voordat je je data communiceert je belangrijkste punten op. Vraag jezelf vervolgens bij elke stap in de voorbereiding van het verhaal dat je wilt vertellen: "Hoe past dit in het verhaal dat ik vertel?"
+
+Let op – Hoewel beginnen met het einde in gedachten ideaal is, wil je niet alleen de data communiceren die je belangrijkste punten ondersteunt. Dit wordt Cherry-Picking genoemd, wat gebeurt wanneer een communicator alleen data communiceert die zijn of haar punt ondersteunt en alle andere data negeert.
+
+Als alle data die je hebt verzameld duidelijk je belangrijkste punten ondersteunt, geweldig. Maar als er data is die je punten niet ondersteunt, of zelfs een argument tegen je belangrijkste punten ondersteunt, moet je die data ook communiceren. Wees in dat geval eerlijk tegen je publiek en leg uit waarom je ervoor kiest om bij je verhaal te blijven, zelfs als niet alle data het ondersteunt.
+
+### 3. Benader het als een Echt Verhaal
+Een traditioneel verhaal verloopt in 5 fasen. Misschien heb je deze fasen gehoord als Expositie, Oplopende Actie, Climax, Afnemende Actie en Ontknoping. Of eenvoudiger: Context, Conflict, Climax, Afsluiting, Conclusie. Bij het communiceren van je data en je verhaal kun je een vergelijkbare aanpak hanteren.
+
+Begin met de context, schets de situatie en zorg ervoor dat je publiek op dezelfde lijn zit. Introduceer vervolgens het conflict. Waarom moest je deze data verzamelen? Welke problemen probeerde je op te lossen? Daarna komt de climax. Wat is de data? Wat betekent de data? Welke oplossingen geeft de data aan? Vervolgens kom je bij de afsluiting, waar je het probleem en de voorgestelde oplossing(en) kunt herhalen. Tot slot kom je bij de conclusie, waar je je belangrijkste punten samenvat en de volgende stappen aanbeveelt.
+
+### 4. Gebruik Betekenisvolle Woorden & Zinnen
+Als ik tegen je zou zeggen: "Onze gebruikers doen er lang over om zich aan te melden op ons platform," hoe lang zou je dan denken dat "lang" is? Een uur? Een week? Het is moeilijk te zeggen. Wat als ik dat tegen een heel publiek zou zeggen? Iedereen in het publiek zou een ander idee kunnen hebben van hoe lang gebruikers erover doen om zich aan te melden.
+
+Wat als ik in plaats daarvan zou zeggen: "Onze gebruikers doen er gemiddeld 3 minuten over om zich aan te melden op ons platform."
+
+Die boodschap is veel duidelijker. Bij het communiceren van data is het gemakkelijk om te denken dat iedereen in je publiek hetzelfde denkt als jij. Maar dat is niet altijd het geval. Het is jouw verantwoordelijkheid als communicator om duidelijkheid te scheppen over je data en wat het betekent. Als het verhaal of de data niet duidelijk is, zal je publiek moeite hebben om het te volgen, en is het minder waarschijnlijk dat ze je belangrijkste punten begrijpen.
+
+Je kunt data duidelijker communiceren door betekenisvolle woorden en zinnen te gebruiken in plaats van vage. Hieronder staan enkele voorbeelden:
+
+- We hadden een *indrukwekkend* jaar!
+ - De ene persoon kan denken dat indrukwekkend een stijging van 2% - 3% betekent, terwijl een ander denkt aan 50% - 60%.
+- Het succespercentage van onze gebruikers is *dramatisch* gestegen.
+ - Hoe groot is een dramatische stijging?
+- Deze taak vereist *aanzienlijke* inspanning.
+ - Hoeveel inspanning is aanzienlijk?
+
+Vage woorden kunnen nuttig zijn als introductie tot meer data die nog komt, of als samenvatting van het verhaal dat je net hebt verteld. Maar zorg ervoor dat elk deel van je presentatie duidelijk is voor je publiek.
+
+### 5. Gebruik Emotie
+Emotie is essentieel bij verhalen vertellen. Het is nog belangrijker wanneer je een verhaal vertelt met data. Bij het communiceren van data draait alles om de belangrijkste punten die je wilt dat je publiek onthoudt. Door emotie op te roepen bij je publiek, help je hen empathie te voelen en vergroot je de kans dat ze actie ondernemen. Emotie verhoogt ook de kans dat je publiek je boodschap onthoudt.
+
+Je hebt dit misschien eerder ervaren met tv-reclames. Sommige reclames zijn erg somber en gebruiken een verdrietige emotie om een connectie te maken met hun publiek en de data die ze presenteren echt te laten opvallen. Andere reclames zijn juist heel vrolijk en maken je blij, waardoor je hun data met een positief gevoel associeert.
+
+Hoe gebruik je emotie bij het communiceren van data? Hieronder staan een paar manieren:
+
+- Gebruik Getuigenissen en Persoonlijke Verhalen
+ - Verzamel zowel kwantitatieve als kwalitatieve data en integreer beide typen data in je communicatie. Als je data voornamelijk kwantitatief is, zoek dan verhalen van individuen om meer te leren over hun ervaring met wat je data vertelt.
+- Gebruik Beelden
+ - Beelden helpen een publiek zichzelf in een situatie te zien. Door beelden te gebruiken, kun je je publiek sturen naar de emotie die ze volgens jou zouden moeten voelen over je data.
+- Gebruik Kleur
+ - Verschillende kleuren roepen verschillende emoties op. Populaire kleuren en de emoties die ze oproepen zijn hieronder weergegeven. Let op: kleuren kunnen in verschillende culturen verschillende betekenissen hebben.
+ - Blauw roept meestal gevoelens van rust en vertrouwen op
+ - Groen wordt vaak geassocieerd met natuur en milieu
+ - Rood staat vaak voor passie en opwinding
+ - Geel wordt vaak geassocieerd met optimisme en geluk
+
+# Communicatie Case Study
+Emerson is een Product Manager voor een mobiele app. Emerson heeft opgemerkt dat klanten in het weekend 42% meer klachten en bugrapporten indienen. Emerson merkte ook dat klanten die een klacht indienen die na 48 uur onbeantwoord blijft, 32% meer kans hebben om de app een beoordeling van 1 of 2 sterren te geven in de app store.
+
+Na onderzoek heeft Emerson een paar oplossingen gevonden die het probleem kunnen aanpakken. Emerson plant een vergadering van 30 minuten met de 3 leidinggevenden van het bedrijf om de data en de voorgestelde oplossingen te communiceren.
+
+Tijdens deze vergadering is het doel van Emerson om de leidinggevenden te laten begrijpen dat de onderstaande 2 oplossingen de beoordeling van de app kunnen verbeteren, wat waarschijnlijk zal leiden tot hogere inkomsten.
+
+**Oplossing 1.** Klantenservicemedewerkers inhuren om in het weekend te werken
+
+**Oplossing 2.** Een nieuw ticketsysteem voor klantenservice aanschaffen waarmee medewerkers gemakkelijk kunnen zien welke klachten het langst in de wachtrij staan – zodat ze weten welke ze het eerst moeten behandelen.
+In de vergadering besteedt Emerson 5 minuten aan het uitleggen waarom een lage beoordeling in de app store slecht is, 10 minuten aan het uitleggen van het onderzoeksproces en hoe de trends zijn geïdentificeerd, 10 minuten aan het doornemen van enkele recente klachten van klanten, en de laatste 5 minuten aan het vluchtig bespreken van de 2 mogelijke oplossingen.
+
+Was dit een effectieve manier voor Emerson om te communiceren tijdens deze vergadering?
+
+Tijdens de vergadering richtte één van de leidinggevenden zich volledig op de 10 minuten waarin Emerson de klachten van klanten besprak. Na de vergadering waren deze klachten het enige wat deze teamleider zich herinnerde. Een andere leidinggevende richtte zich vooral op Emersons uitleg over het onderzoeksproces. De derde leidinggevende herinnerde zich wel de voorgestelde oplossingen, maar wist niet zeker hoe die oplossingen geïmplementeerd konden worden.
+
+In de bovenstaande situatie kun je zien dat er een aanzienlijke kloof was tussen wat Emerson wilde dat de leidinggevenden uit de vergadering zouden meenemen, en wat ze uiteindelijk meenamen. Hieronder staat een andere aanpak die Emerson zou kunnen overwegen.
+
+Hoe kan Emerson deze aanpak verbeteren?
+Context, Conflict, Climax, Closure, Conclusie
+**Context** - Emerson zou de eerste 5 minuten kunnen besteden aan het introduceren van de hele situatie en ervoor zorgen dat de leidinggevenden begrijpen hoe de problemen van invloed zijn op belangrijke bedrijfsstatistieken, zoals de omzet.
+
+Het zou als volgt kunnen worden gepresenteerd: "Op dit moment heeft onze app een beoordeling van 2,5 in de app store. Beoordelingen in de app store zijn cruciaal voor App Store Optimization, wat invloed heeft op hoeveel gebruikers onze app zien in zoekresultaten en hoe potentiële gebruikers onze app beoordelen. En natuurlijk is het aantal gebruikers direct gekoppeld aan de omzet."
+
+**Conflict** Emerson zou vervolgens ongeveer 5 minuten kunnen besteden aan het bespreken van het conflict.
+
+Het zou als volgt kunnen worden verwoord: “Gebruikers dienen 42% meer klachten en bugrapporten in tijdens het weekend. Klanten die een klacht indienen die na 48 uur onbeantwoord blijft, zijn 32% minder geneigd om onze app een beoordeling van meer dan een 2 te geven in de app store. Het verbeteren van de beoordeling van onze app in de app store naar een 4 zou onze zichtbaarheid met 20-30% verbeteren, wat volgens mijn schatting de omzet met 10% zou verhogen." Uiteraard moet Emerson voorbereid zijn om deze cijfers te onderbouwen.
+
+**Climax** Na het leggen van de basis kan Emerson vervolgens ongeveer 5 minuten besteden aan de Climax.
+
+Emerson kan de voorgestelde oplossingen introduceren, uitleggen hoe deze oplossingen de geschetste problemen aanpakken, hoe deze oplossingen in bestaande workflows kunnen worden geïntegreerd, wat de kosten van de oplossingen zijn, wat het rendement op investering (ROI) zou zijn, en misschien zelfs enkele screenshots of wireframes laten zien van hoe de oplossingen eruit zouden zien als ze worden geïmplementeerd. Emerson kan ook getuigenissen delen van gebruikers die langer dan 48 uur moesten wachten op een reactie op hun klacht, en zelfs een getuigenis van een huidige klantenservicemedewerker binnen het bedrijf die opmerkingen heeft over het huidige ticketsysteem.
+
+**Closure** Vervolgens kan Emerson 5 minuten besteden aan het herhalen van de problemen waarmee het bedrijf wordt geconfronteerd, de voorgestelde oplossingen opnieuw bekijken en uitleggen waarom die oplossingen de juiste zijn.
+
+**Conclusie** Omdat dit een vergadering is met een paar belanghebbenden waarin tweerichtingscommunicatie wordt gebruikt, kan Emerson plannen om 10 minuten vrij te maken voor vragen, zodat alles wat onduidelijk was voor de leidinggevenden kan worden opgehelderd voordat de vergadering voorbij is.
+
+Als Emerson aanpak #2 zou volgen, is de kans veel groter dat de leidinggevenden uit de vergadering meenemen wat Emerson wilde dat ze zouden meenemen – namelijk dat de manier waarop klachten en bugs worden afgehandeld verbeterd kan worden, en dat er 2 oplossingen zijn die kunnen worden geïmplementeerd om die verbetering te realiseren. Deze aanpak zou een veel effectievere manier zijn om de gegevens en het verhaal dat Emerson wil overbrengen, te communiceren.
+
+# Conclusie
+### Samenvatting van de belangrijkste punten
+- Communiceren betekent informatie overbrengen of uitwisselen.
+- Bij het communiceren van gegevens moet je doel niet simpelweg zijn om cijfers door te geven aan je publiek. Je doel moet zijn om een verhaal te vertellen dat door je gegevens wordt ondersteund.
+- Er zijn 2 soorten communicatie: eenrichtingscommunicatie (informatie wordt gecommuniceerd zonder de intentie van een reactie) en tweerichtingscommunicatie (informatie wordt heen en weer gecommuniceerd).
+- Er zijn veel strategieën die je kunt gebruiken om een verhaal te vertellen met je gegevens. Vijf strategieën die we hebben besproken zijn:
+ - Begrijp je publiek, je medium en je communicatiemethode
+ - Begin met het einddoel in gedachten
+ - Benader het als een echt verhaal
+ - Gebruik betekenisvolle woorden en zinnen
+ - Gebruik emotie
+
+### Aanbevolen bronnen voor zelfstudie
+[The Five C's of Storytelling - Articulate Persuasion](http://articulatepersuasion.com/the-five-cs-of-storytelling/)
+
+[1.4 Your Responsibilities as a Communicator – Business Communication for Success (umn.edu)](https://open.lib.umn.edu/businesscommunication/chapter/1-4-your-responsibilities-as-a-communicator/)
+
+[How to Tell a Story with Data (hbr.org)](https://hbr.org/2013/04/how-to-tell-a-story-with-data)
+
+[Two-Way Communication: 4 Tips for a More Engaged Workplace (yourthoughtpartner.com)](https://www.yourthoughtpartner.com/blog/bid/59576/4-steps-to-increase-employee-engagement-through-two-way-communication)
+
+[6 succinct steps to great data storytelling - BarnRaisers, LLC (barnraisersllc.com)](https://barnraisersllc.com/2021/05/02/6-succinct-steps-to-great-data-storytelling/)
+
+[How to Tell a Story With Data | Lucidchart Blog](https://www.lucidchart.com/blog/how-to-tell-a-story-with-data)
+
+[6 Cs of Effective Storytelling on Social Media | Cooler Insights](https://coolerinsights.com/2018/06/effective-storytelling-social-media/)
+
+[The Importance of Emotions In Presentations | Ethos3 - A Presentation Training and Design Agency](https://ethos3.com/2015/02/the-importance-of-emotions-in-presentations/)
+
+[Data storytelling: linking emotions and rational decisions (toucantoco.com)](https://www.toucantoco.com/en/blog/data-storytelling-dataviz)
+
+[Emotional Advertising: How Brands Use Feelings to Get People to Buy (hubspot.com)](https://blog.hubspot.com/marketing/emotions-in-advertising-examples)
+
+[Choosing Colors for Your Presentation Slides | Think Outside The Slide](https://www.thinkoutsidetheslide.com/choosing-colors-for-your-presentation-slides/)
+
+[How To Present Data [10 Expert Tips] | ObservePoint](https://resources.observepoint.com/blog/10-tips-for-presenting-data)
+
+[Microsoft Word - Persuasive Instructions.doc (tpsnva.org)](https://www.tpsnva.org/teach/lq/016/persinstr.pdf)
+
+[The Power of Story for Your Data (thinkhdi.com)](https://www.thinkhdi.com/library/supportworld/2019/power-story-your-data.aspx)
+
+[Common Mistakes in Data Presentation (perceptualedge.com)](https://www.perceptualedge.com/articles/ie/data_presentation.pdf)
+
+[Infographic: Here are 15 Common Data Fallacies to Avoid (visualcapitalist.com)](https://www.visualcapitalist.com/here-are-15-common-data-fallacies-to-avoid/)
+
+[Cherry Picking: When People Ignore Evidence that They Dislike – Effectiviology](https://effectiviology.com/cherry-picking/#How_to_avoid_cherry_picking)
+
+[Tell Stories with Data: Communication in Data Science | by Sonali Verghese | Towards Data Science](https://towardsdatascience.com/tell-stories-with-data-communication-in-data-science-5266f7671d7)
+
+[1. Communicating Data - Communicating Data with Tableau [Book] (oreilly.com)](https://www.oreilly.com/library/view/communicating-data-with/9781449372019/ch01.html)
+
+## [Post-Lecture Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/31)
+
+Beoordeel wat je zojuist hebt geleerd met de bovenstaande Post-Lecture Quiz!
+
+## Opdracht
+
+[Marktonderzoek](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/4-Data-Science-Lifecycle/16-communication/assignment.md b/translations/nl/4-Data-Science-Lifecycle/16-communication/assignment.md
new file mode 100644
index 00000000..42d01074
--- /dev/null
+++ b/translations/nl/4-Data-Science-Lifecycle/16-communication/assignment.md
@@ -0,0 +1,26 @@
+
+# Vertel een verhaal
+
+## Instructies
+
+Data Science draait om het vertellen van verhalen. Kies een dataset en schrijf een kort artikel over het verhaal dat je ermee zou kunnen vertellen. Wat hoop je dat je dataset kan onthullen? Wat doe je als de onthullingen problematisch blijken te zijn? Wat als je data zijn geheimen niet gemakkelijk prijsgeeft? Denk na over de scenario's die je dataset zou kunnen presenteren en schrijf ze op.
+
+## Beoordelingscriteria
+
+Uitmuntend | Voldoende | Verbetering Nodig
+--- | --- | -- |
+
+Een essay van één pagina wordt gepresenteerd in .doc-formaat, waarin de dataset wordt uitgelegd, gedocumenteerd, gecrediteerd, en een samenhangend verhaal wordt gepresenteerd met gedetailleerde voorbeelden uit de data. | Een korter essay wordt gepresenteerd in een minder gedetailleerd formaat. | Het essay mist een van de bovengenoemde details.
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/4-Data-Science-Lifecycle/README.md b/translations/nl/4-Data-Science-Lifecycle/README.md
new file mode 100644
index 00000000..cf58320c
--- /dev/null
+++ b/translations/nl/4-Data-Science-Lifecycle/README.md
@@ -0,0 +1,30 @@
+
+# De levenscyclus van Data Science
+
+
+> Foto door Headway op Unsplash
+
+In deze lessen verken je enkele aspecten van de levenscyclus van Data Science, waaronder analyse en communicatie rondom data.
+
+### Onderwerpen
+
+1. [Introductie](14-Introduction/README.md)
+2. [Analyseren](15-analyzing/README.md)
+3. [Communicatie](16-communication/README.md)
+
+### Credits
+
+Deze lessen zijn met ❤️ geschreven door [Jalen McGee](https://twitter.com/JalenMCG) en [Jasmine Greenaway](https://twitter.com/paladique)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/5-Data-Science-In-Cloud/17-Introduction/README.md b/translations/nl/5-Data-Science-In-Cloud/17-Introduction/README.md
new file mode 100644
index 00000000..daf01931
--- /dev/null
+++ b/translations/nl/5-Data-Science-In-Cloud/17-Introduction/README.md
@@ -0,0 +1,114 @@
+
+# Introductie tot Data Science in de Cloud
+
+| ](../../sketchnotes/17-DataScience-Cloud.png)|
+|:---:|
+| Data Science In The Cloud: Introductie - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+
+In deze les leer je de fundamentele principes van de Cloud, ontdek je waarom het interessant kan zijn om Cloud-diensten te gebruiken voor je data science-projecten, en bekijken we enkele voorbeelden van data science-projecten die in de Cloud worden uitgevoerd.
+
+## [Pre-Lecture Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/32)
+
+## Wat is de Cloud?
+
+De Cloud, of Cloud Computing, is het leveren van een breed scala aan betaalbare computerdiensten via een infrastructuur op het internet. Diensten omvatten oplossingen zoals opslag, databases, netwerken, software, analytics en intelligente diensten.
+
+We onderscheiden meestal de Publieke, Private en Hybride clouds als volgt:
+
+* Publieke cloud: een publieke cloud is eigendom van en wordt beheerd door een externe cloudserviceprovider die zijn computermiddelen via het internet aan het publiek levert.
+* Private cloud: verwijst naar cloudcomputing-middelen die exclusief door één bedrijf of organisatie worden gebruikt, met diensten en een infrastructuur die worden onderhouden op een privé-netwerk.
+* Hybride cloud: de hybride cloud is een systeem dat publieke en private clouds combineert. Gebruikers kiezen voor een datacenter op locatie, terwijl ze gegevens en applicaties laten draaien op een of meer publieke clouds.
+
+De meeste cloudcomputing-diensten vallen in drie categorieën: Infrastructure as a Service (IaaS), Platform as a Service (PaaS) en Software as a Service (SaaS).
+
+* Infrastructure as a Service (IaaS): gebruikers huren een IT-infrastructuur zoals servers en virtuele machines (VMs), opslag, netwerken, besturingssystemen.
+* Platform as a Service (PaaS): gebruikers huren een omgeving voor het ontwikkelen, testen, leveren en beheren van softwareapplicaties. Gebruikers hoeven zich geen zorgen te maken over het opzetten of beheren van de onderliggende infrastructuur van servers, opslag, netwerk en databases die nodig zijn voor ontwikkeling.
+* Software as a Service (SaaS): gebruikers krijgen toegang tot softwareapplicaties via het internet, op aanvraag en meestal op abonnementsbasis. Gebruikers hoeven zich geen zorgen te maken over het hosten en beheren van de softwareapplicatie, de onderliggende infrastructuur of het onderhoud, zoals software-upgrades en beveiligingspatches.
+
+Enkele van de grootste Cloud-providers zijn Amazon Web Services, Google Cloud Platform en Microsoft Azure.
+
+## Waarom kiezen voor de Cloud voor Data Science?
+
+Ontwikkelaars en IT-professionals kiezen om met de Cloud te werken om verschillende redenen, waaronder:
+
+* Innovatie: je kunt je applicaties versterken door innovatieve diensten van Cloud-providers direct in je apps te integreren.
+* Flexibiliteit: je betaalt alleen voor de diensten die je nodig hebt en kunt kiezen uit een breed scala aan diensten. Je betaalt meestal naar gebruik en past je diensten aan je veranderende behoeften aan.
+* Budget: je hoeft geen initiële investeringen te doen om hardware en software aan te schaffen, datacenters op te zetten en te beheren. Je betaalt alleen voor wat je gebruikt.
+* Schaalbaarheid: je middelen kunnen worden aangepast aan de behoeften van je project, wat betekent dat je apps meer of minder rekenkracht, opslag en bandbreedte kunnen gebruiken, afhankelijk van externe factoren op elk moment.
+* Productiviteit: je kunt je richten op je bedrijf in plaats van tijd te besteden aan taken die door anderen kunnen worden beheerd, zoals het beheren van datacenters.
+* Betrouwbaarheid: Cloud Computing biedt verschillende manieren om je gegevens continu te back-uppen en je kunt rampenherstelplannen opstellen om je bedrijf en diensten draaiende te houden, zelfs in crisistijden.
+* Beveiliging: je kunt profiteren van beleidsregels, technologieën en controles die de beveiliging van je project versterken.
+
+Dit zijn enkele van de meest voorkomende redenen waarom mensen ervoor kiezen om Cloud-diensten te gebruiken. Nu we een beter begrip hebben van wat de Cloud is en wat de belangrijkste voordelen zijn, laten we specifiek kijken naar de taken van datawetenschappers en ontwikkelaars die met data werken, en hoe de Cloud hen kan helpen met verschillende uitdagingen waarmee ze te maken kunnen krijgen:
+
+* Opslaan van grote hoeveelheden data: in plaats van grote servers te kopen, beheren en beschermen, kun je je data direct in de Cloud opslaan, met oplossingen zoals Azure Cosmos DB, Azure SQL Database en Azure Data Lake Storage.
+* Data-integratie uitvoeren: data-integratie is een essentieel onderdeel van Data Science, waarmee je de overgang maakt van dataverzameling naar actie ondernemen. Met data-integratiediensten die in de Cloud worden aangeboden, kun je data verzamelen, transformeren en integreren vanuit verschillende bronnen in een enkel datawarehouse, met Data Factory.
+* Data verwerken: het verwerken van grote hoeveelheden data vereist veel rekenkracht, en niet iedereen heeft toegang tot krachtige machines. Daarom kiezen veel mensen ervoor om direct gebruik te maken van de enorme rekenkracht van de Cloud om hun oplossingen uit te voeren en te implementeren.
+* Gebruik maken van data-analyse diensten: Cloud-diensten zoals Azure Synapse Analytics, Azure Stream Analytics en Azure Databricks helpen je om je data om te zetten in bruikbare inzichten.
+* Gebruik maken van Machine Learning en data-intelligentie diensten: in plaats van vanaf nul te beginnen, kun je gebruik maken van machine learning-algoritmen die door de Cloud-provider worden aangeboden, met diensten zoals AzureML. Je kunt ook cognitieve diensten gebruiken zoals spraak-naar-tekst, tekst-naar-spraak, computervisie en meer.
+
+## Voorbeelden van Data Science in de Cloud
+
+Laten we dit concreter maken door een paar scenario's te bekijken.
+
+### Real-time sentimentanalyse van sociale media
+We beginnen met een scenario dat vaak wordt bestudeerd door mensen die beginnen met machine learning: sentimentanalyse van sociale media in real-time.
+
+Stel dat je een nieuwssite beheert en je wilt live data gebruiken om te begrijpen welke content je lezers interessant zouden kunnen vinden. Om hier meer over te weten te komen, kun je een programma bouwen dat real-time sentimentanalyse uitvoert op data van Twitter-publicaties, over onderwerpen die relevant zijn voor je lezers.
+
+De belangrijkste indicatoren waar je naar kijkt zijn het aantal tweets over specifieke onderwerpen (hashtags) en sentiment, dat wordt vastgesteld met analysetools die sentimentanalyse uitvoeren rond de gespecificeerde onderwerpen.
+
+De stappen die nodig zijn om dit project te maken zijn als volgt:
+
+* Maak een event hub voor streaming input, die data van Twitter verzamelt.
+* Configureer en start een Twitter-clientapplicatie, die de Twitter Streaming APIs aanroept.
+* Maak een Stream Analytics-taak.
+* Specificeer de taakinput en query.
+* Maak een output sink en specificeer de taakoutput.
+* Start de taak.
+
+Bekijk de volledige procedure in de [documentatie](https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?WT.mc_id=academic-77958-bethanycheum&ocid=AID30411099).
+
+### Analyse van wetenschappelijke artikelen
+Laten we een ander voorbeeld bekijken van een project gemaakt door [Dmitry Soshnikov](http://soshnikov.com), een van de auteurs van dit curriculum.
+
+Dmitry heeft een tool gemaakt die COVID-artikelen analyseert. Door dit project te bekijken, zie je hoe je een tool kunt maken die kennis uit wetenschappelijke artikelen haalt, inzichten verkrijgt en onderzoekers helpt om efficiënt door grote collecties artikelen te navigeren.
+
+Laten we de verschillende stappen bekijken die hiervoor zijn gebruikt:
+* Informatie extraheren en voorbewerken met [Text Analytics for Health](https://docs.microsoft.com/azure/cognitive-services/text-analytics/how-tos/text-analytics-for-health?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+* Gebruik maken van [Azure ML](https://azure.microsoft.com/services/machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) om de verwerking te paralleliseren.
+* Informatie opslaan en opvragen met [Cosmos DB](https://azure.microsoft.com/services/cosmos-db?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+* Een interactieve dashboard maken voor data-exploratie en visualisatie met Power BI.
+
+Bekijk de volledige procedure op [Dmitry’s blog](https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/).
+
+Zoals je kunt zien, kunnen we Cloud-diensten op veel manieren benutten om Data Science uit te voeren.
+
+## Voetnoot
+
+Bronnen:
+* https://azure.microsoft.com/overview/what-is-cloud-computing?ocid=AID3041109
+* https://docs.microsoft.com/azure/stream-analytics/stream-analytics-twitter-sentiment-analysis-trends?ocid=AID3041109
+* https://soshnikov.com/science/analyzing-medical-papers-with-azure-and-text-analytics-for-health/
+
+## Post-Lecture Quiz
+
+[Post-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/33)
+
+## Opdracht
+
+[Marktonderzoek](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/5-Data-Science-In-Cloud/17-Introduction/assignment.md b/translations/nl/5-Data-Science-In-Cloud/17-Introduction/assignment.md
new file mode 100644
index 00000000..96db7e5e
--- /dev/null
+++ b/translations/nl/5-Data-Science-In-Cloud/17-Introduction/assignment.md
@@ -0,0 +1,25 @@
+
+# Marktonderzoek
+
+## Instructies
+
+In deze les heb je geleerd dat er verschillende belangrijke cloudproviders zijn. Doe wat marktonderzoek om te ontdekken wat elke provider te bieden heeft aan de Data Scientist. Zijn de aanbiedingen vergelijkbaar? Schrijf een verslag waarin je de aanbiedingen van drie of meer van deze cloudproviders beschrijft.
+
+## Rubriek
+
+Uitmuntend | Voldoende | Verbetering nodig
+--- | --- | --- |
+Een verslag van één pagina beschrijft de data science-aanbiedingen van drie cloudproviders en maakt onderscheid tussen hen. | Een korter verslag wordt gepresenteerd | Een verslag wordt gepresenteerd zonder de analyse te voltooien
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/5-Data-Science-In-Cloud/18-Low-Code/README.md b/translations/nl/5-Data-Science-In-Cloud/18-Low-Code/README.md
new file mode 100644
index 00000000..41029dc8
--- /dev/null
+++ b/translations/nl/5-Data-Science-In-Cloud/18-Low-Code/README.md
@@ -0,0 +1,348 @@
+
+# Datawetenschap in de Cloud: De "Low code/No code" aanpak
+
+| ](../../sketchnotes/18-DataScience-Cloud.png)|
+|:---:|
+| Datawetenschap in de Cloud: Low Code - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+Inhoudsopgave:
+
+- [Datawetenschap in de Cloud: De "Low code/No code" aanpak](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [Pre-Lecture quiz](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [1. Introductie](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [1.1 Wat is Azure Machine Learning?](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [1.2 Het Hartfalen Voorspellingsproject:](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [1.3 De Hartfalen Dataset:](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2. Low code/No code training van een model in Azure ML Studio](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.1 Een Azure ML-werkruimte maken](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.2 Compute Resources](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.2.1 De juiste opties kiezen voor je compute resources](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.2.2 Een compute cluster maken](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.3 De dataset laden](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [2.4 Low code/No Code training met AutoML](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [3. Low code/No Code modelimplementatie en endpointgebruik](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [3.1 Modelimplementatie](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [3.2 Endpointgebruik](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [🚀 Uitdaging](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [Post-Lecture Quiz](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [Review & Zelfstudie](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+ - [Opdracht](../../../../5-Data-Science-In-Cloud/18-Low-Code)
+
+## [Pre-Lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/34)
+## 1. Introductie
+### 1.1 Wat is Azure Machine Learning?
+
+Het Azure-cloudplatform bestaat uit meer dan 200 producten en clouddiensten die zijn ontworpen om je te helpen nieuwe oplossingen tot leven te brengen. Datawetenschappers besteden veel tijd aan het verkennen en voorbewerken van data, en het testen van verschillende soorten modeltrainingsalgoritmen om nauwkeurige modellen te produceren. Deze taken kosten veel tijd en maken vaak inefficiënt gebruik van dure computerhardware.
+
+[Azure ML](https://docs.microsoft.com/azure/machine-learning/overview-what-is-azure-machine-learning?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) is een cloudgebaseerd platform voor het bouwen en beheren van machine learning-oplossingen in Azure. Het bevat een breed scala aan functies en mogelijkheden die datawetenschappers helpen bij het voorbereiden van data, trainen van modellen, publiceren van voorspellende diensten en het monitoren van gebruik. Het belangrijkste is dat het hun efficiëntie verhoogt door veel van de tijdrovende taken die gepaard gaan met het trainen van modellen te automatiseren; en het stelt hen in staat om gebruik te maken van cloudgebaseerde compute resources die effectief schalen om grote hoeveelheden data te verwerken, terwijl kosten alleen worden gemaakt wanneer ze daadwerkelijk worden gebruikt.
+
+Azure ML biedt alle tools die ontwikkelaars en datawetenschappers nodig hebben voor hun machine learning-workflows. Deze omvatten:
+
+- **Azure Machine Learning Studio**: een webportaal in Azure Machine Learning voor low-code en no-code opties voor modeltraining, implementatie, automatisering, tracking en assetbeheer. De studio integreert met de Azure Machine Learning SDK voor een naadloze ervaring.
+- **Jupyter Notebooks**: snel prototypen en testen van ML-modellen.
+- **Azure Machine Learning Designer**: stelt je in staat om modules te slepen en neer te zetten om experimenten te bouwen en vervolgens pipelines te implementeren in een low-code omgeving.
+- **Automated machine learning UI (AutoML)**: automatiseert iteratieve taken van machine learning-modelontwikkeling, waardoor je ML-modellen kunt bouwen met hoge schaal, efficiëntie en productiviteit, terwijl de modelkwaliteit behouden blijft.
+- **Data Labelling**: een ondersteunde ML-tool om data automatisch te labelen.
+- **Machine learning-extensie voor Visual Studio Code**: biedt een volledige ontwikkelomgeving voor het bouwen en beheren van ML-projecten.
+- **Machine learning CLI**: biedt commando's voor het beheren van Azure ML-resources via de commandoregel.
+- **Integratie met open-source frameworks** zoals PyTorch, TensorFlow, Scikit-learn en vele anderen voor het trainen, implementeren en beheren van het end-to-end machine learning-proces.
+- **MLflow**: een open-source bibliotheek voor het beheren van de levenscyclus van je machine learning-experimenten. **MLFlow Tracking** is een component van MLflow dat je trainingsrun-metrics en modelartefacten logt en bijhoudt, ongeacht de omgeving van je experiment.
+
+### 1.2 Het Hartfalen Voorspellingsproject:
+
+Er is geen twijfel dat het maken en bouwen van projecten de beste manier is om je vaardigheden en kennis op de proef te stellen. In deze les gaan we twee verschillende manieren verkennen om een datawetenschapsproject te bouwen voor het voorspellen van hartfalenaanvallen in Azure ML Studio, via Low code/No code en via de Azure ML SDK zoals weergegeven in het volgende schema:
+
+
+
+Elke methode heeft zijn eigen voor- en nadelen. De Low code/No code aanpak is gemakkelijker om mee te beginnen, omdat het werken met een GUI (Graphical User Interface) inhoudt, zonder dat voorafgaande kennis van code vereist is. Deze methode maakt snelle tests van de haalbaarheid van het project mogelijk en het creëren van een POC (Proof Of Concept). Echter, naarmate het project groeit en productie klaar moet zijn, is het niet haalbaar om resources via een GUI te creëren. We moeten alles programmatisch automatiseren, van het creëren van resources tot het implementeren van een model. Dit is waar kennis van de Azure ML SDK cruciaal wordt.
+
+| | Low code/No code | Azure ML SDK |
+|-------------------|------------------|---------------------------|
+| Expertise in code | Niet vereist | Vereist |
+| Ontwikkeltijd | Snel en eenvoudig| Afhankelijk van codekennis|
+| Productieklaar | Nee | Ja |
+
+### 1.3 De Hartfalen Dataset:
+
+Hart- en vaatziekten (CVD's) zijn wereldwijd de nummer 1 doodsoorzaak, goed voor 31% van alle sterfgevallen. Omgevings- en gedragsrisicofactoren zoals tabaksgebruik, ongezonde voeding en obesitas, lichamelijke inactiviteit en schadelijk alcoholgebruik kunnen worden gebruikt als kenmerken voor schattingsmodellen. Het kunnen inschatten van de kans op het ontwikkelen van een CVD kan van groot nut zijn om aanvallen bij mensen met een hoog risico te voorkomen.
+
+Kaggle heeft een [Hartfalen dataset](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data) openbaar beschikbaar gesteld, die we gaan gebruiken voor dit project. Je kunt de dataset nu downloaden. Dit is een tabelvormige dataset met 13 kolommen (12 kenmerken en 1 doelvariabele) en 299 rijen.
+
+| | Variabelenaam | Type | Beschrijving | Voorbeeld |
+|----|---------------------------|-----------------|-----------------------------------------------------------|-------------------|
+| 1 | age | numeriek | Leeftijd van de patiënt | 25 |
+| 2 | anaemia | boolean | Afname van rode bloedcellen of hemoglobine | 0 of 1 |
+| 3 | creatinine_phosphokinase | numeriek | Niveau van CPK-enzym in het bloed | 542 |
+| 4 | diabetes | boolean | Of de patiënt diabetes heeft | 0 of 1 |
+| 5 | ejection_fraction | numeriek | Percentage bloed dat het hart verlaat bij elke contractie | 45 |
+| 6 | high_blood_pressure | boolean | Of de patiënt hypertensie heeft | 0 of 1 |
+| 7 | platelets | numeriek | Bloedplaatjes in het bloed | 149000 |
+| 8 | serum_creatinine | numeriek | Niveau van serumcreatinine in het bloed | 0.5 |
+| 9 | serum_sodium | numeriek | Niveau van serumnatrium in het bloed | jun |
+| 10 | sex | boolean | Vrouw of man | 0 of 1 |
+| 11 | smoking | boolean | Of de patiënt rookt | 0 of 1 |
+| 12 | time | numeriek | Follow-up periode (dagen) | 4 |
+|----|---------------------------|-----------------|-----------------------------------------------------------|-------------------|
+| 21 | DEATH_EVENT [Doel] | boolean | Of de patiënt overlijdt tijdens de follow-up periode | 0 of 1 |
+
+Zodra je de dataset hebt, kunnen we beginnen met het project in Azure.
+
+## 2. Low code/No code training van een model in Azure ML Studio
+### 2.1 Een Azure ML-werkruimte maken
+Om een model te trainen in Azure ML moet je eerst een Azure ML-werkruimte maken. De werkruimte is de top-level resource voor Azure Machine Learning en biedt een gecentraliseerde plek om te werken met alle artefacten die je maakt wanneer je Azure Machine Learning gebruikt. De werkruimte houdt een geschiedenis bij van alle trainingsruns, inclusief logs, metrics, output en een snapshot van je scripts. Je gebruikt deze informatie om te bepalen welke trainingsrun het beste model produceert. [Meer informatie](https://docs.microsoft.com/azure/machine-learning/concept-workspace?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
+
+Het wordt aanbevolen om de meest up-to-date browser te gebruiken die compatibel is met je besturingssysteem. De volgende browsers worden ondersteund:
+
+- Microsoft Edge (De nieuwe Microsoft Edge, nieuwste versie. Niet Microsoft Edge legacy)
+- Safari (nieuwste versie, alleen Mac)
+- Chrome (nieuwste versie)
+- Firefox (nieuwste versie)
+
+Om Azure Machine Learning te gebruiken, maak je een werkruimte in je Azure-abonnement. Je kunt deze werkruimte vervolgens gebruiken om data, compute resources, code, modellen en andere artefacten met betrekking tot je machine learning-workloads te beheren.
+
+> **_LET OP:_** Je Azure-abonnement wordt een klein bedrag in rekening gebracht voor datastorage zolang de Azure Machine Learning-werkruimte bestaat in je abonnement, dus we raden aan om de Azure Machine Learning-werkruimte te verwijderen wanneer je deze niet meer gebruikt.
+
+1. Log in op het [Azure-portaal](https://ms.portal.azure.com/) met de Microsoft-gegevens die zijn gekoppeld aan je Azure-abonnement.
+2. Selecteer **+Een resource maken**
+
+ 
+
+ Zoek naar Machine Learning en selecteer de Machine Learning-tegel
+
+ 
+
+ Klik op de knop "maken"
+
+ 
+
+ Vul de instellingen in als volgt:
+ - Abonnement: Je Azure-abonnement
+ - Resourcegroep: Maak of selecteer een resourcegroep
+ - Werkruimte naam: Voer een unieke naam in voor je werkruimte
+ - Regio: Selecteer de geografische regio die het dichtst bij je in de buurt is
+ - Opslagaccount: Let op het standaard nieuwe opslagaccount dat wordt aangemaakt voor je werkruimte
+ - Key vault: Let op de standaard nieuwe key vault die wordt aangemaakt voor je werkruimte
+ - Application insights: Let op de standaard nieuwe application insights resource die wordt aangemaakt voor je werkruimte
+ - Container registry: Geen (er wordt automatisch een aangemaakt de eerste keer dat je een model implementeert in een container)
+
+ 
+
+ - Klik op "creëren + review" en vervolgens op de knop "creëren"
+3. Wacht tot je werkruimte is aangemaakt (dit kan enkele minuten duren). Ga vervolgens naar de werkruimte in het portaal. Je kunt deze vinden via de Machine Learning Azure-service.
+4. Op de Overzichtspagina van je werkruimte, start Azure Machine Learning Studio (of open een nieuwe browser tab en navigeer naar https://ml.azure.com), en log in op Azure Machine Learning Studio met je Microsoft-account. Indien gevraagd, selecteer je je Azure-directory en abonnement, en je Azure Machine Learning-werkruimte.
+
+
+
+5. In Azure Machine Learning Studio, schakel je het ☰-icoon linksboven in om de verschillende pagina's in de interface te bekijken. Je kunt deze pagina's gebruiken om de resources in je werkruimte te beheren.
+
+
+
+Je kunt je werkruimte beheren via het Azure-portaal, maar voor datawetenschappers en Machine Learning operations engineers biedt Azure Machine Learning Studio een meer gerichte gebruikersinterface voor het beheren van werkruimteresources.
+
+### 2.2 Compute Resources
+
+Compute Resources zijn cloudgebaseerde resources waarop je modeltraining en data-exploratieprocessen kunt uitvoeren. Er zijn vier soorten compute resources die je kunt maken:
+
+- **Compute Instances**: Ontwikkelwerkstations die datawetenschappers kunnen gebruiken om met data en modellen te werken. Dit omvat het maken van een Virtual Machine (VM) en het starten van een notebook-instantie. Je kunt vervolgens een model trainen door een compute cluster aan te roepen vanuit de notebook.
+- **Compute Clusters**: Schaalbare clusters van VM's voor on-demand verwerking van experimentcode. Je hebt dit nodig bij het trainen van een model. Compute clusters kunnen ook gespecialiseerde GPU- of CPU-resources gebruiken.
+- **Inference Clusters**: Implementatiedoelen voor voorspellende diensten die je getrainde modellen gebruiken.
+- **Aangesloten Compute**: Verwijst naar bestaande Azure compute-resources, zoals Virtual Machines of Azure Databricks-clusters.
+
+#### 2.2.1 De juiste opties kiezen voor je compute-resources
+
+Er zijn een aantal belangrijke factoren om te overwegen bij het aanmaken van een compute-resource, en deze keuzes kunnen cruciale beslissingen zijn.
+
+**Heb je een CPU of GPU nodig?**
+
+Een CPU (Central Processing Unit) is het elektronische circuit dat instructies uitvoert die een computerprogramma vormen. Een GPU (Graphics Processing Unit) is een gespecialiseerd elektronisch circuit dat grafisch gerelateerde code met een zeer hoge snelheid kan uitvoeren.
+
+Het belangrijkste verschil tussen CPU- en GPU-architectuur is dat een CPU is ontworpen om een breed scala aan taken snel uit te voeren (gemeten aan de hand van de kloksnelheid van de CPU), maar beperkt is in de gelijktijdigheid van taken die kunnen worden uitgevoerd. GPU's zijn ontworpen voor parallelle verwerking en zijn daarom veel beter geschikt voor deep learning-taken.
+
+| CPU | GPU |
+|-----------------------------------------|-----------------------------|
+| Minder duur | Duurder |
+| Lager niveau van gelijktijdigheid | Hoger niveau van gelijktijdigheid |
+| Langzamer bij het trainen van deep learning-modellen | Optimaal voor deep learning |
+
+**Cluster Grootte**
+
+Grotere clusters zijn duurder, maar zorgen voor betere responsiviteit. Als je dus tijd hebt maar niet veel geld, kun je beter met een klein cluster beginnen. Heb je daarentegen geld maar weinig tijd, dan kun je beter met een groter cluster beginnen.
+
+**VM Grootte**
+
+Afhankelijk van je tijd en budget kun je de grootte van je RAM, schijf, aantal cores en kloksnelheid variëren. Het verhogen van al deze parameters zal duurder zijn, maar resulteert in betere prestaties.
+
+**Dedicated of Low-Priority Instances?**
+
+Een low-priority instance betekent dat deze onderbreekbaar is: Microsoft Azure kan deze resources toewijzen aan een andere taak, waardoor een job wordt onderbroken. Een dedicated instance, of niet-onderbreekbaar, betekent dat de job nooit zonder jouw toestemming wordt beëindigd. Dit is opnieuw een afweging tussen tijd en geld, aangezien onderbreekbare instances goedkoper zijn dan dedicated instances.
+
+#### 2.2.2 Een compute-cluster aanmaken
+
+In de [Azure ML-werkruimte](https://ml.azure.com/) die we eerder hebben aangemaakt, ga naar Compute en je zult de verschillende compute-resources zien die we zojuist hebben besproken (zoals compute-instances, compute-clusters, inference-clusters en aangesloten compute). Voor dit project hebben we een compute-cluster nodig voor modeltraining. Klik in de Studio op het menu "Compute", vervolgens op het tabblad "Compute cluster" en klik op de knop "+ Nieuw" om een compute-cluster aan te maken.
+
+
+
+1. Kies je opties: Dedicated vs Low priority, CPU of GPU, VM-grootte en aantal cores (je kunt de standaardinstellingen voor dit project behouden).
+2. Klik op de knop Volgende.
+
+
+
+3. Geef het cluster een naam.
+4. Kies je opties: Minimum/Maximum aantal nodes, Idle seconden voordat wordt afgeschaald, SSH-toegang. Let op: als het minimum aantal nodes 0 is, bespaar je geld wanneer het cluster inactief is. Let op: hoe hoger het maximum aantal nodes, hoe korter de training zal duren. Het aanbevolen maximum aantal nodes is 3.
+5. Klik op de knop "Aanmaken". Deze stap kan enkele minuten duren.
+
+
+
+Geweldig! Nu we een compute-cluster hebben, moeten we de gegevens in Azure ML Studio laden.
+
+### 2.3 Het dataset laden
+
+1. In de [Azure ML-werkruimte](https://ml.azure.com/) die we eerder hebben aangemaakt, klik op "Datasets" in het linkermenu en klik op de knop "+ Dataset aanmaken" om een dataset aan te maken. Kies de optie "Van lokale bestanden" en selecteer de Kaggle-dataset die we eerder hebben gedownload.
+
+ 
+
+2. Geef je dataset een naam, een type en een beschrijving. Klik op Volgende. Upload de gegevens vanuit bestanden. Klik op Volgende.
+
+ 
+
+3. Wijzig in het Schema het gegevenstype naar Boolean voor de volgende kenmerken: anaemia, diabetes, high blood pressure, sex, smoking en DEATH_EVENT. Klik op Volgende en klik op Aanmaken.
+
+ 
+
+Geweldig! Nu de dataset is geladen en het compute-cluster is aangemaakt, kunnen we beginnen met het trainen van het model!
+
+### 2.4 Low code/No code training met AutoML
+
+Traditionele machine learning-modelontwikkeling is arbeidsintensief, vereist aanzienlijke domeinkennis en kost tijd om tientallen modellen te produceren en te vergelijken. Geautomatiseerde machine learning (AutoML) automatiseert de tijdrovende, iteratieve taken van machine learning-modelontwikkeling. Het stelt datawetenschappers, analisten en ontwikkelaars in staat om ML-modellen te bouwen met hoge schaalbaarheid, efficiëntie en productiviteit, terwijl de modelkwaliteit behouden blijft. Het verkort de tijd die nodig is om productieklare ML-modellen te krijgen, met groot gemak en efficiëntie. [Meer informatie](https://docs.microsoft.com/azure/machine-learning/concept-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
+
+1. In de [Azure ML-werkruimte](https://ml.azure.com/) die we eerder hebben aangemaakt, klik op "Automated ML" in het linkermenu en selecteer de dataset die je zojuist hebt geüpload. Klik op Volgende.
+
+ 
+
+2. Voer een nieuwe experimentnaam in, de doelkolom (DEATH_EVENT) en het compute-cluster dat we hebben aangemaakt. Klik op Volgende.
+
+ 
+
+3. Kies "Classificatie" en klik op Voltooien. Deze stap kan tussen de 30 minuten en 1 uur duren, afhankelijk van de grootte van je compute-cluster.
+
+ 
+
+4. Zodra de run is voltooid, klik op het tabblad "Automated ML", klik op je run en klik op het algoritme in de kaart "Best model summary".
+
+ 
+
+Hier kun je een gedetailleerde beschrijving zien van het beste model dat AutoML heeft gegenereerd. Je kunt ook andere modellen verkennen in het tabblad Modellen. Neem een paar minuten de tijd om de modellen in de knop Uitleg (preview) te bekijken. Zodra je het model hebt gekozen dat je wilt gebruiken (hier kiezen we het beste model dat door AutoML is geselecteerd), bekijken we hoe we het kunnen implementeren.
+
+## 3. Low code/No code modelimplementatie en endpoint-consumptie
+### 3.1 Modelimplementatie
+
+De geautomatiseerde machine learning-interface stelt je in staat om het beste model als een webservice te implementeren in een paar stappen. Implementatie is de integratie van het model zodat het voorspellingen kan doen op basis van nieuwe gegevens en potentiële kansen kan identificeren. Voor dit project betekent implementatie naar een webservice dat medische applicaties het model kunnen gebruiken om live voorspellingen te doen over het risico van hun patiënten op een hartaanval.
+
+Klik in de beschrijving van het beste model op de knop "Implementeren".
+
+
+
+15. Geef het een naam, een beschrijving, het computertype (Azure Container Instance), schakel authenticatie in en klik op Implementeren. Deze stap kan ongeveer 20 minuten duren. Het implementatieproces omvat verschillende stappen, waaronder het registreren van het model, het genereren van resources en het configureren ervan voor de webservice. Een statusbericht verschijnt onder Implementatiestatus. Selecteer Periodiek vernieuwen om de implementatiestatus te controleren. Het is geïmplementeerd en actief wanneer de status "Gezond" is.
+
+
+
+16. Zodra het is geïmplementeerd, klik op het tabblad Endpoint en klik op het endpoint dat je zojuist hebt geïmplementeerd. Hier kun je alle details vinden die je moet weten over het endpoint.
+
+
+
+Geweldig! Nu we een model hebben geïmplementeerd, kunnen we beginnen met het consumeren van het endpoint.
+
+### 3.2 Endpoint-consumptie
+
+Klik op het tabblad "Consumeren". Hier vind je het REST-endpoint en een Python-script in de consumptieoptie. Neem de tijd om de Python-code te lezen.
+
+Dit script kan rechtstreeks vanaf je lokale machine worden uitgevoerd en zal je endpoint consumeren.
+
+
+
+Neem een moment om deze 2 regels code te bekijken:
+
+```python
+url = 'http://98e3715f-xxxx-xxxx-xxxx-9ec22d57b796.centralus.azurecontainer.io/score'
+api_key = '' # Replace this with the API key for the web service
+```
+De `url`-variabele is het REST-endpoint dat je vindt in het tabblad Consumeren en de `api_key`-variabele is de primaire sleutel die je ook vindt in het tabblad Consumeren (alleen als je authenticatie hebt ingeschakeld). Dit is hoe het script het endpoint kan consumeren.
+
+18. Als je het script uitvoert, zou je de volgende uitvoer moeten zien:
+ ```python
+ b'"{\\"result\\": [true]}"'
+ ```
+Dit betekent dat de voorspelling van hartfalen voor de opgegeven gegevens waar is. Dit is logisch, want als je de gegevens die automatisch in het script zijn gegenereerd nader bekijkt, staat alles standaard op 0 en onwaar. Je kunt de gegevens wijzigen met het volgende invoervoorbeeld:
+
+```python
+data = {
+ "data":
+ [
+ {
+ 'age': "0",
+ 'anaemia': "false",
+ 'creatinine_phosphokinase': "0",
+ 'diabetes': "false",
+ 'ejection_fraction': "0",
+ 'high_blood_pressure': "false",
+ 'platelets': "0",
+ 'serum_creatinine': "0",
+ 'serum_sodium': "0",
+ 'sex': "false",
+ 'smoking': "false",
+ 'time': "0",
+ },
+ {
+ 'age': "60",
+ 'anaemia': "false",
+ 'creatinine_phosphokinase': "500",
+ 'diabetes': "false",
+ 'ejection_fraction': "38",
+ 'high_blood_pressure': "false",
+ 'platelets': "260000",
+ 'serum_creatinine': "1.40",
+ 'serum_sodium': "137",
+ 'sex': "false",
+ 'smoking': "false",
+ 'time': "130",
+ },
+ ],
+}
+```
+Het script zou moeten retourneren:
+ ```python
+ b'"{\\"result\\": [true, false]}"'
+ ```
+
+Gefeliciteerd! Je hebt zojuist het model geconsumeerd dat is geïmplementeerd en getraind in Azure ML!
+
+> **_OPMERKING:_** Zodra je klaar bent met het project, vergeet niet om alle resources te verwijderen.
+
+## 🚀 Uitdaging
+
+Bekijk de modeluitleg en details die AutoML heeft gegenereerd voor de beste modellen. Probeer te begrijpen waarom het beste model beter is dan de andere. Welke algoritmen zijn vergeleken? Wat zijn de verschillen tussen hen? Waarom presteert het beste model in dit geval beter?
+
+## [Post-Lecture Quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/35)
+
+## Review & Zelfstudie
+
+In deze les heb je geleerd hoe je een model kunt trainen, implementeren en consumeren om het risico op hartfalen te voorspellen op een Low code/No code-manier in de cloud. Als je het nog niet hebt gedaan, duik dan dieper in de modeluitleg die AutoML heeft gegenereerd voor de beste modellen en probeer te begrijpen waarom het beste model beter is dan de andere.
+
+Je kunt verder gaan met Low code/No code AutoML door deze [documentatie](https://docs.microsoft.com/azure/machine-learning/tutorial-first-experiment-automated-ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) te lezen.
+
+## Opdracht
+
+[Low code/No code Data Science-project op Azure ML](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/5-Data-Science-In-Cloud/18-Low-Code/assignment.md b/translations/nl/5-Data-Science-In-Cloud/18-Low-Code/assignment.md
new file mode 100644
index 00000000..100dcecd
--- /dev/null
+++ b/translations/nl/5-Data-Science-In-Cloud/18-Low-Code/assignment.md
@@ -0,0 +1,25 @@
+
+# Low code/No code Data Science-project op Azure ML
+
+## Instructies
+
+We hebben gezien hoe je het Azure ML-platform kunt gebruiken om een model te trainen, implementeren en gebruiken op een Low code/No code-manier. Zoek nu naar wat gegevens die je kunt gebruiken om een ander model te trainen, te implementeren en te gebruiken. Je kunt datasets vinden op [Kaggle](https://kaggle.com) en [Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+
+## Rubric
+
+| Uitmuntend | Voldoende | Verbetering Nodig |
+|------------|-----------|-------------------|
+|Bij het uploaden van de gegevens heb je ervoor gezorgd dat je indien nodig het type van de kenmerken hebt aangepast. Je hebt ook de gegevens schoongemaakt indien nodig. Je hebt een training uitgevoerd op een dataset via AutoML en je hebt de modelverklaringen gecontroleerd. Je hebt het beste model geïmplementeerd en je kon het gebruiken. | Bij het uploaden van de gegevens heb je ervoor gezorgd dat je indien nodig het type van de kenmerken hebt aangepast. Je hebt een training uitgevoerd op een dataset via AutoML, je hebt het beste model geïmplementeerd en je kon het gebruiken. | Je hebt het beste model dat door AutoML is getraind geïmplementeerd en je kon het gebruiken. |
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/5-Data-Science-In-Cloud/19-Azure/README.md b/translations/nl/5-Data-Science-In-Cloud/19-Azure/README.md
new file mode 100644
index 00000000..81a052d5
--- /dev/null
+++ b/translations/nl/5-Data-Science-In-Cloud/19-Azure/README.md
@@ -0,0 +1,313 @@
+
+# Datawetenschap in de Cloud: De "Azure ML SDK"-aanpak
+
+| ](../../sketchnotes/19-DataScience-Cloud.png)|
+|:---:|
+| Datawetenschap in de Cloud: Azure ML SDK - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+Inhoudsopgave:
+
+- [Datawetenschap in de Cloud: De "Azure ML SDK"-aanpak](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [Quiz voorafgaand aan de les](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [1. Introductie](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [1.1 Wat is Azure ML SDK?](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [1.2 Introductie van het project en dataset voor hartfalenvoorspelling](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2. Een model trainen met de Azure ML SDK](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.1 Een Azure ML-werkruimte maken](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.2 Een compute-instantie maken](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.3 De dataset laden](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.4 Notebooks maken](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.5 Een model trainen](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.5.1 Werkruimte, experiment, compute-cluster en dataset instellen](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [2.5.2 AutoML-configuratie en training](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [3. Modelimplementatie en gebruik van endpoints met de Azure ML SDK](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [3.1 Het beste model opslaan](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [3.2 Modelimplementatie](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [3.3 Gebruik van endpoints](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [🚀 Uitdaging](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [Quiz na de les](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [Review & Zelfstudie](../../../../5-Data-Science-In-Cloud/19-Azure)
+ - [Opdracht](../../../../5-Data-Science-In-Cloud/19-Azure)
+
+## [Quiz voorafgaand aan de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/36)
+
+## 1. Introductie
+
+### 1.1 Wat is Azure ML SDK?
+
+Datawetenschappers en AI-ontwikkelaars gebruiken de Azure Machine Learning SDK om machine learning-workflows te bouwen en uit te voeren met de Azure Machine Learning-service. Je kunt met de service werken in elke Python-omgeving, zoals Jupyter Notebooks, Visual Studio Code of je favoriete Python IDE.
+
+Belangrijke functies van de SDK zijn:
+
+- Verkennen, voorbereiden en beheren van de levenscyclus van datasets die worden gebruikt in machine learning-experimenten.
+- Beheren van cloudresources voor monitoring, logging en het organiseren van je machine learning-experimenten.
+- Modellen trainen, lokaal of met behulp van cloudresources, inclusief GPU-versnelde modeltraining.
+- Gebruik maken van geautomatiseerde machine learning, waarbij configuratieparameters en trainingsdata worden geaccepteerd. Het doorloopt automatisch algoritmen en hyperparameterinstellingen om het beste model te vinden voor voorspellingen.
+- Webservices implementeren om je getrainde modellen om te zetten in RESTful services die in elke applicatie kunnen worden gebruikt.
+
+[Meer informatie over de Azure Machine Learning SDK](https://docs.microsoft.com/python/api/overview/azure/ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)
+
+In de [vorige les](../18-Low-Code/README.md) hebben we gezien hoe je een model kunt trainen, implementeren en gebruiken op een Low code/No code-manier. We gebruikten de dataset voor hartfalen om een voorspellingsmodel voor hartfalen te genereren. In deze les gaan we precies hetzelfde doen, maar dan met behulp van de Azure Machine Learning SDK.
+
+
+
+### 1.2 Introductie van het project en dataset voor hartfalenvoorspelling
+
+Bekijk [hier](../18-Low-Code/README.md) de introductie van het project en de dataset voor hartfalenvoorspelling.
+
+## 2. Een model trainen met de Azure ML SDK
+### 2.1 Een Azure ML-werkruimte maken
+
+Voor de eenvoud gaan we werken in een Jupyter Notebook. Dit betekent dat je al een werkruimte en een compute-instantie hebt. Als je al een werkruimte hebt, kun je direct doorgaan naar sectie 2.3 Notebook maken.
+
+Zo niet, volg dan de instructies in de sectie **2.1 Een Azure ML-werkruimte maken** in de [vorige les](../18-Low-Code/README.md) om een werkruimte te maken.
+
+### 2.2 Een compute-instantie maken
+
+Ga in de [Azure ML-werkruimte](https://ml.azure.com/) die we eerder hebben gemaakt naar het compute-menu en je ziet de verschillende beschikbare compute-resources.
+
+
+
+Laten we een compute-instantie maken om een Jupyter Notebook te voorzien.
+1. Klik op de knop + Nieuw.
+2. Geef een naam aan je compute-instantie.
+3. Kies je opties: CPU of GPU, VM-grootte en aantal cores.
+4. Klik op de knop Maken.
+
+Gefeliciteerd, je hebt zojuist een compute-instantie gemaakt! We zullen deze compute-instantie gebruiken om een Notebook te maken in de sectie [Notebooks maken](../../../../5-Data-Science-In-Cloud/19-Azure).
+
+### 2.3 De dataset laden
+Raadpleeg de [vorige les](../18-Low-Code/README.md) in de sectie **2.3 De dataset laden** als je de dataset nog niet hebt geüpload.
+
+### 2.4 Notebooks maken
+
+> **_OPMERKING:_** Voor de volgende stap kun je een nieuw notebook helemaal opnieuw maken, of je kunt het [notebook dat we hebben gemaakt](notebook.ipynb) uploaden in je Azure ML Studio. Om het te uploaden, klik je gewoon op het "Notebook"-menu en upload je het notebook.
+
+Notebooks zijn een heel belangrijk onderdeel van het datawetenschapsproces. Ze kunnen worden gebruikt om Exploratory Data Analysis (EDA) uit te voeren, een computercluster aan te roepen om een model te trainen, of een inferentiecluster aan te roepen om een endpoint te implementeren.
+
+Om een Notebook te maken, hebben we een compute-node nodig die de Jupyter Notebook-instantie uitvoert. Ga terug naar de [Azure ML-werkruimte](https://ml.azure.com/) en klik op Compute-instanties. In de lijst met compute-instanties zou je de [compute-instantie die we eerder hebben gemaakt](../../../../5-Data-Science-In-Cloud/19-Azure) moeten zien.
+
+1. Klik in de sectie Toepassingen op de optie Jupyter.
+2. Vink het vakje "Ja, ik begrijp het" aan en klik op de knop Doorgaan.
+
+3. Dit zou een nieuw browsertabblad moeten openen met je Jupyter Notebook-instantie zoals hieronder. Klik op de knop "Nieuw" om een notebook te maken.
+
+
+
+Nu we een Notebook hebben, kunnen we beginnen met het trainen van het model met Azure ML SDK.
+
+### 2.5 Een model trainen
+
+Allereerst, als je ooit twijfelt, raadpleeg dan de [Azure ML SDK-documentatie](https://docs.microsoft.com/python/api/overview/azure/ml?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109). Het bevat alle benodigde informatie om de modules te begrijpen die we in deze les gaan behandelen.
+
+#### 2.5.1 Werkruimte, experiment, compute-cluster en dataset instellen
+
+Je moet de `werkruimte` laden vanuit het configuratiebestand met de volgende code:
+
+```python
+from azureml.core import Workspace
+ws = Workspace.from_config()
+```
+
+Dit retourneert een object van het type `Workspace` dat de werkruimte vertegenwoordigt. Vervolgens moet je een `experiment` maken met de volgende code:
+
+```python
+from azureml.core import Experiment
+experiment_name = 'aml-experiment'
+experiment = Experiment(ws, experiment_name)
+```
+Om een experiment op te halen of te maken vanuit een werkruimte, vraag je het experiment op met de naam van het experiment. De naam van het experiment moet 3-36 tekens bevatten, beginnen met een letter of een cijfer, en mag alleen letters, cijfers, underscores en streepjes bevatten. Als het experiment niet wordt gevonden in de werkruimte, wordt er een nieuw experiment gemaakt.
+
+Nu moet je een compute-cluster maken voor de training met de volgende code. Merk op dat deze stap enkele minuten kan duren.
+
+```python
+from azureml.core.compute import AmlCompute
+
+aml_name = "heart-f-cluster"
+try:
+ aml_compute = AmlCompute(ws, aml_name)
+ print('Found existing AML compute context.')
+except:
+ print('Creating new AML compute context.')
+ aml_config = AmlCompute.provisioning_configuration(vm_size = "Standard_D2_v2", min_nodes=1, max_nodes=3)
+ aml_compute = AmlCompute.create(ws, name = aml_name, provisioning_configuration = aml_config)
+ aml_compute.wait_for_completion(show_output = True)
+
+cts = ws.compute_targets
+compute_target = cts[aml_name]
+```
+
+Je kunt de dataset ophalen uit de werkruimte met behulp van de datasetnaam op de volgende manier:
+
+```python
+dataset = ws.datasets['heart-failure-records']
+df = dataset.to_pandas_dataframe()
+df.describe()
+```
+#### 2.5.2 AutoML-configuratie en training
+
+Om de AutoML-configuratie in te stellen, gebruik je de [AutoMLConfig-klasse](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.automlconfig(class)?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+
+Zoals beschreven in de documentatie zijn er veel parameters waarmee je kunt spelen. Voor dit project zullen we de volgende parameters gebruiken:
+
+- `experiment_timeout_minutes`: De maximale tijdsduur (in minuten) die het experiment mag duren voordat het automatisch wordt gestopt en de resultaten automatisch beschikbaar worden gemaakt.
+- `max_concurrent_iterations`: Het maximale aantal gelijktijdige trainingsiteraties dat is toegestaan voor het experiment.
+- `primary_metric`: De primaire metriek die wordt gebruikt om de status van het experiment te bepalen.
+- `compute_target`: Het Azure Machine Learning compute-doel waarop het geautomatiseerde machine learning-experiment wordt uitgevoerd.
+- `task`: Het type taak dat moet worden uitgevoerd. Waarden kunnen 'classification', 'regression' of 'forecasting' zijn, afhankelijk van het type geautomatiseerd ML-probleem dat moet worden opgelost.
+- `training_data`: De trainingsdata die binnen het experiment moeten worden gebruikt. Het moet zowel trainingskenmerken als een labelkolom bevatten (optioneel een kolom met gewichten).
+- `label_column_name`: De naam van de labelkolom.
+- `path`: Het volledige pad naar de Azure Machine Learning-projectmap.
+- `enable_early_stopping`: Of vroegtijdige beëindiging moet worden ingeschakeld als de score op korte termijn niet verbetert.
+- `featurization`: Indicator of de featurization-stap automatisch moet worden uitgevoerd of niet, of dat aangepaste featurization moet worden gebruikt.
+- `debug_log`: Het logbestand waarin debuginformatie wordt geschreven.
+
+```python
+from azureml.train.automl import AutoMLConfig
+
+project_folder = './aml-project'
+
+automl_settings = {
+ "experiment_timeout_minutes": 20,
+ "max_concurrent_iterations": 3,
+ "primary_metric" : 'AUC_weighted'
+}
+
+automl_config = AutoMLConfig(compute_target=compute_target,
+ task = "classification",
+ training_data=dataset,
+ label_column_name="DEATH_EVENT",
+ path = project_folder,
+ enable_early_stopping= True,
+ featurization= 'auto',
+ debug_log = "automl_errors.log",
+ **automl_settings
+ )
+```
+Nu je configuratie is ingesteld, kun je het model trainen met de volgende code. Deze stap kan tot een uur duren, afhankelijk van de grootte van je cluster.
+
+```python
+remote_run = experiment.submit(automl_config)
+```
+Je kunt de RunDetails-widget uitvoeren om de verschillende experimenten te tonen.
+```python
+from azureml.widgets import RunDetails
+RunDetails(remote_run).show()
+```
+## 3. Modelimplementatie en gebruik van endpoints met de Azure ML SDK
+
+### 3.1 Het beste model opslaan
+
+De `remote_run` is een object van het type [AutoMLRun](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.run.automlrun?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109). Dit object bevat de methode `get_output()` die de beste run en het bijbehorende getrainde model retourneert.
+
+```python
+best_run, fitted_model = remote_run.get_output()
+```
+Je kunt de parameters die voor het beste model zijn gebruikt bekijken door gewoon het fitted_model af te drukken en de eigenschappen van het beste model te zien met de [get_properties()](https://docs.microsoft.com/python/api/azureml-core/azureml.core.run(class)?view=azure-ml-py#azureml_core_Run_get_properties?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)-methode.
+
+```python
+best_run.get_properties()
+```
+
+Registreer nu het model met de [register_model](https://docs.microsoft.com/python/api/azureml-train-automl-client/azureml.train.automl.run.automlrun?view=azure-ml-py#register-model-model-name-none--description-none--tags-none--iteration-none--metric-none-?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)-methode.
+```python
+model_name = best_run.properties['model_name']
+script_file_name = 'inference/score.py'
+best_run.download_file('outputs/scoring_file_v_1_0_0.py', 'inference/score.py')
+description = "aml heart failure project sdk"
+model = best_run.register_model(model_name = model_name,
+ model_path = './outputs/',
+ description = description,
+ tags = None)
+```
+### 3.2 Modelimplementatie
+
+Zodra het beste model is opgeslagen, kunnen we het implementeren met de [InferenceConfig](https://docs.microsoft.com/python/api/azureml-core/azureml.core.model.inferenceconfig?view=azure-ml-py?ocid=AID3041109)-klasse. InferenceConfig vertegenwoordigt de configuratie-instellingen voor een aangepaste omgeving die wordt gebruikt voor implementatie. De [AciWebservice](https://docs.microsoft.com/python/api/azureml-core/azureml.core.webservice.aciwebservice?view=azure-ml-py)-klasse vertegenwoordigt een machine learning-model dat is geïmplementeerd als een webservice-endpoint op Azure Container Instances. Een geïmplementeerde service wordt gemaakt van een model, script en bijbehorende bestanden. De resulterende webservice is een load-balanced HTTP-endpoint met een REST API. Je kunt gegevens naar deze API sturen en de voorspelling ontvangen die door het model wordt geretourneerd.
+
+Het model wordt geïmplementeerd met de [deploy](https://docs.microsoft.com/python/api/azureml-core/azureml.core.model(class)?view=azure-ml-py#deploy-workspace--name--models--inference-config-none--deployment-config-none--deployment-target-none--overwrite-false--show-output-false-?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109)-methode.
+
+```python
+from azureml.core.model import InferenceConfig, Model
+from azureml.core.webservice import AciWebservice
+
+inference_config = InferenceConfig(entry_script=script_file_name, environment=best_run.get_environment())
+
+aciconfig = AciWebservice.deploy_configuration(cpu_cores = 1,
+ memory_gb = 1,
+ tags = {'type': "automl-heart-failure-prediction"},
+ description = 'Sample service for AutoML Heart Failure Prediction')
+
+aci_service_name = 'automl-hf-sdk'
+aci_service = Model.deploy(ws, aci_service_name, [model], inference_config, aciconfig)
+aci_service.wait_for_deployment(True)
+print(aci_service.state)
+```
+Deze stap kan enkele minuten duren.
+
+### 3.3 Gebruik van endpoints
+
+Je gebruikt je endpoint door een voorbeeldinvoer te maken:
+
+```python
+data = {
+ "data":
+ [
+ {
+ 'age': "60",
+ 'anaemia': "false",
+ 'creatinine_phosphokinase': "500",
+ 'diabetes': "false",
+ 'ejection_fraction': "38",
+ 'high_blood_pressure': "false",
+ 'platelets': "260000",
+ 'serum_creatinine': "1.40",
+ 'serum_sodium': "137",
+ 'sex': "false",
+ 'smoking': "false",
+ 'time': "130",
+ },
+ ],
+}
+
+test_sample = str.encode(json.dumps(data))
+```
+En vervolgens kun je deze invoer naar je model sturen voor voorspelling:
+```python
+response = aci_service.run(input_data=test_sample)
+response
+```
+Dit zou `'{"result": [false]}'` moeten opleveren. Dit betekent dat de patiëntgegevens die we naar de endpoint hebben gestuurd de voorspelling `false` hebben gegenereerd, wat betekent dat deze persoon waarschijnlijk geen hartaanval zal krijgen.
+
+Gefeliciteerd! Je hebt zojuist het model gebruikt dat is gedeployed en getraind op Azure ML met de Azure ML SDK!
+
+
+> **_NOTE:_** Vergeet niet om alle resources te verwijderen zodra je klaar bent met het project.
+
+## 🚀 Uitdaging
+
+Er zijn veel andere dingen die je kunt doen met de SDK, helaas kunnen we ze niet allemaal in deze les behandelen. Maar goed nieuws, leren hoe je door de SDK-documentatie kunt navigeren kan je een heel eind op weg helpen. Bekijk de Azure ML SDK-documentatie en zoek de `Pipeline`-klasse waarmee je pipelines kunt maken. Een Pipeline is een verzameling stappen die als een workflow kunnen worden uitgevoerd.
+
+**TIP:** Ga naar de [SDK-documentatie](https://docs.microsoft.com/python/api/overview/azure/ml/?view=azure-ml-py?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) en typ trefwoorden zoals "Pipeline" in de zoekbalk. Je zou de `azureml.pipeline.core.Pipeline`-klasse in de zoekresultaten moeten vinden.
+
+## [Quiz na de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/37)
+
+## Review & Zelfstudie
+
+In deze les heb je geleerd hoe je een model kunt trainen, deployen en gebruiken om het risico op hartfalen te voorspellen met de Azure ML SDK in de cloud. Bekijk deze [documentatie](https://docs.microsoft.com/python/api/overview/azure/ml/?view=azure-ml-py?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109) voor meer informatie over de Azure ML SDK. Probeer je eigen model te maken met de Azure ML SDK.
+
+## Opdracht
+
+[Data Science-project met Azure ML SDK](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/5-Data-Science-In-Cloud/19-Azure/assignment.md b/translations/nl/5-Data-Science-In-Cloud/19-Azure/assignment.md
new file mode 100644
index 00000000..1d7e7a75
--- /dev/null
+++ b/translations/nl/5-Data-Science-In-Cloud/19-Azure/assignment.md
@@ -0,0 +1,25 @@
+
+# Data Science-project met Azure ML SDK
+
+## Instructies
+
+We hebben gezien hoe je het Azure ML-platform kunt gebruiken om een model te trainen, te implementeren en te gebruiken met de Azure ML SDK. Zoek nu naar wat data die je kunt gebruiken om een ander model te trainen, te implementeren en te gebruiken. Je kunt datasets vinden op [Kaggle](https://kaggle.com) en [Azure Open Datasets](https://azure.microsoft.com/services/open-datasets/catalog?WT.mc_id=academic-77958-bethanycheum&ocid=AID3041109).
+
+## Rubriek
+
+| Uitmuntend | Voldoende | Verbetering nodig |
+|------------|-----------|-------------------|
+|Bij het configureren van AutoML heb je de SDK-documentatie geraadpleegd om te zien welke parameters je kon gebruiken. Je hebt een training uitgevoerd op een dataset via AutoML met behulp van Azure ML SDK, en je hebt de modelverklaringen gecontroleerd. Je hebt het beste model geïmplementeerd en je kon het gebruiken via de Azure ML SDK. | Je hebt een training uitgevoerd op een dataset via AutoML met behulp van Azure ML SDK, en je hebt de modelverklaringen gecontroleerd. Je hebt het beste model geïmplementeerd en je kon het gebruiken via de Azure ML SDK. | Je hebt een training uitgevoerd op een dataset via AutoML met behulp van Azure ML SDK. Je hebt het beste model geïmplementeerd en je kon het gebruiken via de Azure ML SDK. |
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/5-Data-Science-In-Cloud/README.md b/translations/nl/5-Data-Science-In-Cloud/README.md
new file mode 100644
index 00000000..c301ab77
--- /dev/null
+++ b/translations/nl/5-Data-Science-In-Cloud/README.md
@@ -0,0 +1,35 @@
+
+# Data Science in de Cloud
+
+
+
+> Foto door [Jelleke Vanooteghem](https://unsplash.com/@ilumire) van [Unsplash](https://unsplash.com/s/photos/cloud?orientation=landscape)
+
+Als het gaat om data science met big data, kan de cloud een echte gamechanger zijn. In de komende drie lessen gaan we bekijken wat de cloud is en waarom deze zo nuttig kan zijn. We gaan ook een dataset over hartfalen verkennen en een model bouwen om de kans op hartfalen bij iemand te beoordelen. We zullen de kracht van de cloud gebruiken om een model op twee verschillende manieren te trainen, implementeren en gebruiken. Eén manier maakt gebruik van alleen de gebruikersinterface in een Low code/No code-stijl, de andere manier maakt gebruik van de Azure Machine Learning Software Developer Kit (Azure ML SDK).
+
+
+
+### Onderwerpen
+
+1. [Waarom de Cloud gebruiken voor Data Science?](17-Introduction/README.md)
+2. [Data Science in de Cloud: De "Low code/No code"-methode](18-Low-Code/README.md)
+3. [Data Science in de Cloud: De "Azure ML SDK"-methode](19-Azure/README.md)
+
+### Credits
+Deze lessen zijn geschreven met ☁️ en 💕 door [Maud Levy](https://twitter.com/maudstweets) en [Tiffany Souterre](https://twitter.com/TiffanySouterre)
+
+De data voor het Hartfalenvoorspellingsproject is afkomstig van [
+Larxel](https://www.kaggle.com/andrewmvd) op [Kaggle](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data). Het is gelicentieerd onder de [Attribution 4.0 International (CC BY 4.0)](https://creativecommons.org/licenses/by/4.0/)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/6-Data-Science-In-Wild/20-Real-World-Examples/README.md b/translations/nl/6-Data-Science-In-Wild/20-Real-World-Examples/README.md
new file mode 100644
index 00000000..3f85fbd3
--- /dev/null
+++ b/translations/nl/6-Data-Science-In-Wild/20-Real-World-Examples/README.md
@@ -0,0 +1,155 @@
+
+# Datawetenschap in de Praktijk
+
+|  ](../../sketchnotes/20-DataScience-RealWorld.png) |
+| :--------------------------------------------------------------------------------------------------------------: |
+| Datawetenschap in de Praktijk - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+We zijn bijna aan het einde van deze leerreis!
+
+We begonnen met definities van datawetenschap en ethiek, onderzochten verschillende tools en technieken voor data-analyse en visualisatie, bespraken de levenscyclus van datawetenschap en bekeken hoe workflows voor datawetenschap kunnen worden opgeschaald en geautomatiseerd met cloudcomputingdiensten. Dus je vraagt je waarschijnlijk af: _"Hoe pas ik al deze kennis toe in de praktijk?"_
+
+In deze les verkennen we toepassingen van datawetenschap in de praktijk binnen verschillende industrieën en duiken we in specifieke voorbeelden binnen onderzoek, digitale geesteswetenschappen en duurzaamheid. We bespreken ook mogelijkheden voor studentenprojecten en sluiten af met nuttige bronnen om je leerreis voort te zetten!
+
+## Pre-Lecture Quiz
+
+[Pre-lecture quiz](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/38)
+
+## Datawetenschap + Industrie
+
+Dankzij de democratisering van AI wordt het voor ontwikkelaars steeds eenvoudiger om AI-gestuurde besluitvorming en datagedreven inzichten te ontwerpen en te integreren in gebruikerservaringen en ontwikkelworkflows. Hier zijn enkele voorbeelden van hoe datawetenschap wordt toegepast in de praktijk binnen verschillende industrieën:
+
+ * [Google Flu Trends](https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/) gebruikte datawetenschap om zoektermen te correleren met grieptrends. Hoewel de aanpak gebreken vertoonde, bracht het bewustzijn over de mogelijkheden (en uitdagingen) van datagedreven voorspellingen in de gezondheidszorg.
+
+ * [UPS Routing Predictions](https://www.technologyreview.com/2018/11/21/139000/how-ups-uses-ai-to-outsmart-bad-weather/) - beschrijft hoe UPS datawetenschap en machine learning gebruikt om optimale bezorgroutes te voorspellen, rekening houdend met weersomstandigheden, verkeerspatronen, deadlines en meer.
+
+ * [NYC Taxicab Route Visualization](http://chriswhong.github.io/nyctaxi/) - data verzameld via [Freedom Of Information Laws](https://chriswhong.com/open-data/foil_nyc_taxi/) hielp een dag in het leven van NYC-taxi's te visualiseren, waardoor we inzicht kregen in hoe ze door de drukke stad navigeren, hoeveel ze verdienen en hoe lang ritten duren gedurende een periode van 24 uur.
+
+ * [Uber Data Science Workbench](https://eng.uber.com/dsw/) - gebruikt data (over ophaal- en afleverlocaties, ritduur, voorkeursroutes, etc.) verzameld uit miljoenen Uber-ritten *dagelijks* om een data-analysetool te bouwen die helpt bij prijsbepaling, veiligheid, fraudedetectie en navigatiebeslissingen.
+
+ * [Sportanalyse](https://towardsdatascience.com/scope-of-analytics-in-sports-world-37ed09c39860) - richt zich op _voorspellende analyse_ (team- en spelersanalyse - denk aan [Moneyball](https://datasciencedegree.wisconsin.edu/blog/moneyball-proves-importance-big-data-big-ideas/) - en fanbeheer) en _datavisualisatie_ (team- en fandashboards, games, etc.) met toepassingen zoals talent scouting, sportweddenschappen en voorraad-/locatiebeheer.
+
+ * [Datawetenschap in de bankensector](https://data-flair.training/blogs/data-science-in-banking/) - benadrukt de waarde van datawetenschap in de financiële sector met toepassingen variërend van risicomodellering en fraudedetectie tot klantsegmentatie, realtime voorspellingen en aanbevelingssystemen. Voorspellende analyse drijft ook kritieke maatregelen zoals [kredietscores](https://dzone.com/articles/using-big-data-and-predictive-analytics-for-credit).
+
+ * [Datawetenschap in de gezondheidszorg](https://data-flair.training/blogs/data-science-in-healthcare/) - benadrukt toepassingen zoals medische beeldvorming (bijv. MRI, röntgenfoto's, CT-scans), genomica (DNA-sequencing), medicijnontwikkeling (risicobeoordeling, succesvoorspelling), voorspellende analyse (patiëntenzorg en logistiek), ziekteopsporing en -preventie, enz.
+
+ Afbeeldingsbron: [Data Flair: 6 Amazing Data Science Applications ](https://data-flair.training/blogs/data-science-applications/)
+
+De afbeelding toont andere domeinen en voorbeelden van het toepassen van datawetenschappelijke technieken. Wil je meer toepassingen verkennen? Bekijk de sectie [Review & Self Study](../../../../6-Data-Science-In-Wild/20-Real-World-Examples) hieronder.
+
+## Datawetenschap + Onderzoek
+
+|  ](../../sketchnotes/20-DataScience-Research.png) |
+| :---------------------------------------------------------------------------------------------------------------: |
+| Datawetenschap & Onderzoek - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+Hoewel toepassingen in de praktijk vaak gericht zijn op grootschalige industriële gebruikssituaties, kunnen _onderzoeks_-toepassingen en projecten nuttig zijn vanuit twee perspectieven:
+
+* _Innovatiekansen_ - snelle prototyping van geavanceerde concepten en het testen van gebruikerservaringen voor toepassingen van de volgende generatie.
+* _Implementatie-uitdagingen_ - onderzoek naar mogelijke schade of onbedoelde gevolgen van datawetenschappelijke technologieën in de praktijk.
+
+Voor studenten kunnen deze onderzoeksprojecten zowel leer- als samenwerkingsmogelijkheden bieden die je begrip van het onderwerp verbeteren en je bewustzijn en betrokkenheid vergroten bij relevante mensen of teams die werken in interessegebieden. Hoe zien onderzoeksprojecten eruit en hoe kunnen ze impact maken?
+
+Laten we een voorbeeld bekijken - de [MIT Gender Shades Study](http://gendershades.org/overview.html) van Joy Buolamwini (MIT Media Labs) met een [belangrijk onderzoeksartikel](http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf) mede-auteur van Timnit Gebru (destijds bij Microsoft Research) dat zich richtte op:
+
+ * **Wat:** Het doel van het onderzoeksproject was om _de vooringenomenheid in geautomatiseerde gezichtsherkenningsalgoritmen en datasets_ te evalueren op basis van geslacht en huidskleur.
+ * **Waarom:** Gezichtsherkenning wordt gebruikt in gebieden zoals wetshandhaving, luchthavenbeveiliging, wervingssystemen en meer - contexten waarin onjuiste classificaties (bijv. door vooringenomenheid) economische en sociale schade kunnen veroorzaken voor getroffen individuen of groepen. Het begrijpen (en elimineren of verminderen) van vooringenomenheid is essentieel voor eerlijk gebruik.
+ * **Hoe:** Onderzoekers erkenden dat bestaande benchmarks voornamelijk lichtere huidtypes gebruikten en stelden een nieuwe dataset samen (1000+ afbeeldingen) die _meer gebalanceerd_ was qua geslacht en huidskleur. De dataset werd gebruikt om de nauwkeurigheid van drie geslachtsclassificatieproducten (van Microsoft, IBM & Face++) te evalueren.
+
+Resultaten toonden aan dat hoewel de algehele classificatienauwkeurigheid goed was, er een merkbaar verschil was in foutpercentages tussen verschillende subgroepen - met **misclassificatie** die hoger was voor vrouwen of personen met een donkere huidskleur, wat wijst op vooringenomenheid.
+
+**Belangrijke Uitkomsten:** Het onderzoek bracht bewustzijn dat datawetenschap meer _representatieve datasets_ (gebalanceerde subgroepen) en meer _inclusieve teams_ (diverse achtergronden) nodig heeft om dergelijke vooringenomenheid eerder in AI-oplossingen te herkennen en te elimineren of te verminderen. Onderzoeksinspanningen zoals deze zijn ook instrumenteel in het definiëren van principes en praktijken voor _verantwoordelijke AI_ binnen veel organisaties om eerlijkheid in hun AI-producten en -processen te verbeteren.
+
+**Wil je meer leren over relevante onderzoeksinspanningen bij Microsoft?**
+
+* Bekijk [Microsoft Research Projects](https://www.microsoft.com/research/research-area/artificial-intelligence/?facet%5Btax%5D%5Bmsr-research-area%5D%5B%5D=13556&facet%5Btax%5D%5Bmsr-content-type%5D%5B%5D=msr-project) over Kunstmatige Intelligentie.
+* Verken studentenprojecten van [Microsoft Research Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/).
+* Bekijk het [Fairlearn](https://fairlearn.org/) project en de [Responsible AI](https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3aprimaryr6) initiatieven.
+
+## Datawetenschap + Geesteswetenschappen
+
+|  ](../../sketchnotes/20-DataScience-Humanities.png) |
+| :---------------------------------------------------------------------------------------------------------------: |
+| Datawetenschap & Digitale Geesteswetenschappen - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+Digitale Geesteswetenschappen [wordt gedefinieerd](https://digitalhumanities.stanford.edu/about-dh-stanford) als "een verzameling van praktijken en benaderingen die computationele methoden combineren met geesteswetenschappelijk onderzoek". [Stanford-projecten](https://digitalhumanities.stanford.edu/projects) zoals _"rebooting history"_ en _"poetic thinking"_ illustreren de verbinding tussen [Digitale Geesteswetenschappen en Datawetenschap](https://digitalhumanities.stanford.edu/digital-humanities-and-data-science) - met nadruk op technieken zoals netwerkanalyse, informatievisualisatie, ruimtelijke en tekstanalyse die ons kunnen helpen historische en literaire datasets opnieuw te bekijken om nieuwe inzichten en perspectieven te verkrijgen.
+
+*Wil je een project in dit domein verkennen en uitbreiden?*
+
+Bekijk ["Emily Dickinson and the Meter of Mood"](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671) - een geweldig voorbeeld van [Jen Looper](https://twitter.com/jenlooper) dat onderzoekt hoe we datawetenschap kunnen gebruiken om bekende poëzie opnieuw te bekijken en de betekenis en bijdragen van de auteur in een nieuwe context te herwaarderen. Bijvoorbeeld, _kunnen we het seizoen voorspellen waarin een gedicht is geschreven door de toon of het sentiment te analyseren_ - en wat vertelt dit ons over de gemoedstoestand van de auteur in de betreffende periode?
+
+Om die vraag te beantwoorden, volgen we de stappen van onze datawetenschappelijke levenscyclus:
+ * [`Data Verzamelen`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#acquiring-the-dataset) - om een relevante dataset te verzamelen voor analyse. Opties zijn onder andere het gebruik van een API (bijv. [Poetry DB API](https://poetrydb.org/index.html)) of het scrapen van webpagina's (bijv. [Project Gutenberg](https://www.gutenberg.org/files/12242/12242-h/12242-h.htm)) met tools zoals [Scrapy](https://scrapy.org/).
+ * [`Data Schoonmaken`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#clean-the-data) - legt uit hoe tekst kan worden geformatteerd, geschoond en vereenvoudigd met basisgereedschappen zoals Visual Studio Code en Microsoft Excel.
+ * [`Data Analyseren`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#working-with-the-data-in-a-notebook) - legt uit hoe we de dataset nu kunnen importeren in "Notebooks" voor analyse met Python-pakketten (zoals pandas, numpy en matplotlib) om de data te organiseren en te visualiseren.
+ * [`Sentimentanalyse`](https://gist.github.com/jlooper/ce4d102efd057137bc000db796bfd671#sentiment-analysis-using-cognitive-services) - legt uit hoe we cloudservices zoals Text Analytics kunnen integreren, met behulp van low-code tools zoals [Power Automate](https://flow.microsoft.com/en-us/) voor geautomatiseerde dataverwerkingsworkflows.
+
+Met deze workflow kunnen we de seizoensinvloeden op het sentiment van de gedichten verkennen en ons eigen perspectief op de auteur vormen. Probeer het zelf - en breid de notebook uit om andere vragen te stellen of de data op nieuwe manieren te visualiseren!
+
+> Je kunt enkele tools uit de [Digital Humanities toolkit](https://github.com/Digital-Humanities-Toolkit) gebruiken om deze onderzoekspaden te volgen.
+
+## Datawetenschap + Duurzaamheid
+
+|  ](../../sketchnotes/20-DataScience-Sustainability.png) |
+| :---------------------------------------------------------------------------------------------------------------: |
+| Datawetenschap & Duurzaamheid - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+De [2030 Agenda voor Duurzame Ontwikkeling](https://sdgs.un.org/2030agenda) - aangenomen door alle leden van de Verenigde Naties in 2015 - identificeert 17 doelen, waaronder doelen die gericht zijn op **het beschermen van de planeet** tegen degradatie en de impact van klimaatverandering. Het [Microsoft Sustainability](https://www.microsoft.com/en-us/sustainability) initiatief ondersteunt deze doelen door te onderzoeken hoe technologische oplossingen kunnen bijdragen aan en bouwen aan duurzamere toekomsten met een [focus op 4 doelen](https://dev.to/azure/a-visual-guide-to-sustainable-software-engineering-53hh) - koolstofnegatief, waterpositief, nul afval en biodivers tegen 2030.
+
+Het aanpakken van deze uitdagingen op een schaalbare en tijdige manier vereist denken op cloudschaal - en grootschalige data. Het [Planetary Computer](https://planetarycomputer.microsoft.com/) initiatief biedt 4 componenten om datawetenschappers en ontwikkelaars hierbij te ondersteunen:
+
+ * [Data Catalogus](https://planetarycomputer.microsoft.com/catalog) - met petabytes aan gegevens over aardsystemen (gratis en gehost op Azure).
+ * [Planetary API](https://planetarycomputer.microsoft.com/docs/reference/stac/) - om gebruikers te helpen relevante gegevens te zoeken over ruimte en tijd.
+ * [Hub](https://planetarycomputer.microsoft.com/docs/overview/environment/) - beheerde omgeving voor wetenschappers om enorme geospatiale datasets te verwerken.
+ * [Toepassingen](https://planetarycomputer.microsoft.com/applications) - toont gebruikssituaties en tools voor duurzaamheidsinzichten.
+**Het Planetary Computer Project is momenteel in preview (vanaf september 2021)** - hier is hoe je kunt beginnen met bijdragen aan duurzame oplossingen met behulp van data science.
+
+* [Vraag toegang aan](https://planetarycomputer.microsoft.com/account/request) om te starten met verkennen en in contact te komen met anderen.
+* [Verken de documentatie](https://planetarycomputer.microsoft.com/docs/overview/about) om meer te leren over ondersteunde datasets en API's.
+* Verken toepassingen zoals [Ecosystem Monitoring](https://analytics-lab.org/ecosystemmonitoring/) voor inspiratie voor applicatie-ideeën.
+
+Denk na over hoe je datavisualisatie kunt gebruiken om relevante inzichten in gebieden zoals klimaatverandering en ontbossing bloot te leggen of te versterken. Of denk na over hoe inzichten kunnen worden gebruikt om nieuwe gebruikerservaringen te creëren die gedragsveranderingen stimuleren voor een duurzamer leven.
+
+## Data Science + Studenten
+
+We hebben gesproken over toepassingen in de industrie en onderzoek, en voorbeelden van data science-toepassingen in digitale geesteswetenschappen en duurzaamheid verkend. Dus hoe kun je je vaardigheden ontwikkelen en je expertise delen als beginnende data scientists?
+
+Hier zijn enkele voorbeelden van data science-studentenprojecten om je te inspireren.
+
+ * [MSR Data Science Summer School](https://www.microsoft.com/en-us/research/academic-program/data-science-summer-school/#!projects) met GitHub [projecten](https://github.com/msr-ds3) die onderwerpen verkennen zoals:
+ - [Raciale vooringenomenheid in politiegeweld](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2019-replicating-an-empirical-analysis-of-racial-differences-in-police-use-of-force/) | [Github](https://github.com/msr-ds3/stop-question-frisk)
+ - [Betrouwbaarheid van het NYC Subway-systeem](https://www.microsoft.com/en-us/research/video/data-science-summer-school-2018-exploring-the-reliability-of-the-nyc-subway-system/) | [Github](https://github.com/msr-ds3/nyctransit)
+ * [Digitalisering van materiële cultuur: Onderzoek naar sociaal-economische verdelingen in Sirkap](https://claremont.maps.arcgis.com/apps/Cascade/index.html?appid=bdf2aef0f45a4674ba41cd373fa23afc) - van [Ornella Altunyan](https://twitter.com/ornelladotcom) en team bij Claremont, met behulp van [ArcGIS StoryMaps](https://storymaps.arcgis.com/).
+
+## 🚀 Uitdaging
+
+Zoek naar artikelen die data science-projecten aanbevelen die geschikt zijn voor beginners - zoals [deze 50 onderwerpen](https://www.upgrad.com/blog/data-science-project-ideas-topics-beginners/) of [deze 21 projectideeën](https://www.intellspot.com/data-science-project-ideas) of [deze 16 projecten met broncode](https://data-flair.training/blogs/data-science-project-ideas/) die je kunt analyseren en aanpassen. Vergeet niet om te bloggen over je leerervaringen en je inzichten met ons allemaal te delen.
+
+## Quiz na de les
+
+[Quiz na de les](https://purple-hill-04aebfb03.1.azurestaticapps.net/quiz/39)
+
+## Review & Zelfstudie
+
+Wil je meer use cases verkennen? Hier zijn een paar relevante artikelen:
+ * [17 Data Science-toepassingen en voorbeelden](https://builtin.com/data-science/data-science-applications-examples) - juli 2021
+ * [11 Adembenemende Data Science-toepassingen in de echte wereld](https://myblindbird.com/data-science-applications-real-world/) - mei 2021
+ * [Data Science in de echte wereld](https://towardsdatascience.com/data-science-in-the-real-world/home) - Artikelcollectie
+ * Data Science in: [Onderwijs](https://data-flair.training/blogs/data-science-in-education/), [Landbouw](https://data-flair.training/blogs/data-science-in-agriculture/), [Financiën](https://data-flair.training/blogs/data-science-in-finance/), [Films](https://data-flair.training/blogs/data-science-at-movies/) & meer.
+
+## Opdracht
+
+[Verken een Planetary Computer Dataset](assignment.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md b/translations/nl/6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md
new file mode 100644
index 00000000..b38f6846
--- /dev/null
+++ b/translations/nl/6-Data-Science-In-Wild/20-Real-World-Examples/assignment.md
@@ -0,0 +1,50 @@
+
+# Verken een Planetary Computer Dataset
+
+## Instructies
+
+In deze les hebben we verschillende toepassingsgebieden van datawetenschap besproken, met diepgaande voorbeelden die betrekking hebben op onderzoek, duurzaamheid en digitale geesteswetenschappen. In deze opdracht ga je een van deze voorbeelden in meer detail verkennen en enkele van je inzichten over datavisualisaties en analyses toepassen om conclusies te trekken over duurzaamheidsdata.
+
+Het [Planetary Computer](https://planetarycomputer.microsoft.com/) project bevat datasets en API's die toegankelijk zijn met een account - vraag er een aan als je de bonusstap van de opdracht wilt proberen. De site biedt ook een [Explorer](https://planetarycomputer.microsoft.com/explore) functie die je kunt gebruiken zonder een account aan te maken.
+
+`Stappen:`
+De Explorer-interface (afgebeeld in de screenshot hieronder) laat je een dataset selecteren (uit de beschikbare opties), een vooraf ingestelde query (om data te filteren) en een weergaveoptie (om een relevante visualisatie te maken). In deze opdracht is het jouw taak om:
+
+ 1. Lees de [Explorer documentatie](https://planetarycomputer.microsoft.com/docs/overview/explorer/) - begrijp de opties.
+ 2. Verken de dataset [Catalogus](https://planetarycomputer.microsoft.com/catalog) - leer het doel van elke dataset.
+ 3. Gebruik de Explorer - kies een dataset die je interesseert, selecteer een relevante query en weergaveoptie.
+
+
+
+`Jouw taak:`
+Bestudeer nu de visualisatie die in de browser wordt weergegeven en beantwoord de volgende vragen:
+ * Welke _kenmerken_ heeft de dataset?
+ * Welke _inzichten_ of resultaten biedt de visualisatie?
+ * Wat zijn de _implicaties_ van die inzichten voor de duurzaamheidsdoelen van het project?
+ * Wat zijn de _beperkingen_ van de visualisatie (d.w.z. welke inzichten heb je niet gekregen)?
+ * Als je de ruwe data zou kunnen krijgen, welke _alternatieve visualisaties_ zou je maken, en waarom?
+
+`Bonuspunten:`
+Vraag een account aan - en log in zodra je toegang hebt.
+ * Gebruik de optie _Launch Hub_ om de ruwe data te openen in een Notebook.
+ * Verken de data interactief en implementeer de alternatieve visualisaties die je hebt bedacht.
+ * Analyseer nu je aangepaste visualisaties - kon je de inzichten verkrijgen die je eerder miste?
+
+## Rubriek
+
+Uitmuntend | Voldoende | Verbetering nodig
+--- | --- | -- |
+Alle vijf kernvragen zijn beantwoord. De student heeft duidelijk aangegeven hoe huidige en alternatieve visualisaties inzichten kunnen bieden in duurzaamheidsdoelen of -resultaten.| De student heeft ten minste de top 3 vragen in detail beantwoord, wat aantoont dat ze praktische ervaring hebben opgedaan met de Explorer.| De student heeft meerdere vragen niet beantwoord of onvoldoende detail gegeven, wat aangeeft dat er geen betekenisvolle poging is gedaan voor het project.|
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/6-Data-Science-In-Wild/README.md b/translations/nl/6-Data-Science-In-Wild/README.md
new file mode 100644
index 00000000..b67d0336
--- /dev/null
+++ b/translations/nl/6-Data-Science-In-Wild/README.md
@@ -0,0 +1,25 @@
+
+# Datawetenschap in de praktijk
+
+Toepassingen van datawetenschap in verschillende industrieën.
+
+### Onderwerpen
+
+1. [Datawetenschap in de echte wereld](20-Real-World-Examples/README.md)
+
+### Credits
+
+Geschreven met ❤️ door [Nitya Narasimhan](https://twitter.com/nitya)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertaalservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/CODE_OF_CONDUCT.md b/translations/nl/CODE_OF_CONDUCT.md
new file mode 100644
index 00000000..d3092663
--- /dev/null
+++ b/translations/nl/CODE_OF_CONDUCT.md
@@ -0,0 +1,23 @@
+
+# Microsoft Open Source Gedragscode
+
+Dit project heeft de [Microsoft Open Source Gedragscode](https://opensource.microsoft.com/codeofconduct/) aangenomen.
+
+Bronnen:
+
+- [Microsoft Open Source Gedragscode](https://opensource.microsoft.com/codeofconduct/)
+- [Microsoft Gedragscode FAQ](https://opensource.microsoft.com/codeofconduct/faq/)
+- Neem contact op met [opencode@microsoft.com](mailto:opencode@microsoft.com) voor vragen of zorgen
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we ons best doen om nauwkeurigheid te waarborgen, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/CONTRIBUTING.md b/translations/nl/CONTRIBUTING.md
new file mode 100644
index 00000000..3dad201f
--- /dev/null
+++ b/translations/nl/CONTRIBUTING.md
@@ -0,0 +1,21 @@
+
+# Bijdragen
+
+Dit project verwelkomt bijdragen en suggesties. Voor de meeste bijdragen moet je akkoord gaan met een Contributor License Agreement (CLA), waarin je verklaart dat je het recht hebt om, en daadwerkelijk doet, ons de rechten te geven om jouw bijdrage te gebruiken. Voor meer informatie, bezoek https://cla.microsoft.com.
+
+Wanneer je een pull request indient, zal een CLA-bot automatisch bepalen of je een CLA moet indienen en de PR dienovereenkomstig voorzien van labels en opmerkingen. Volg gewoon de instructies die door de bot worden gegeven. Dit hoef je slechts één keer te doen voor alle repositories die onze CLA gebruiken.
+
+Dit project heeft de [Microsoft Open Source Code of Conduct](https://opensource.microsoft.com/codeofconduct/) aangenomen. Voor meer informatie, zie de [Code of Conduct FAQ](https://opensource.microsoft.com/codeofconduct/faq/) of neem contact op met [opencode@microsoft.com](mailto:opencode@microsoft.com) voor eventuele aanvullende vragen of opmerkingen.
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/README.md b/translations/nl/README.md
new file mode 100644
index 00000000..8287b841
--- /dev/null
+++ b/translations/nl/README.md
@@ -0,0 +1,155 @@
+
+# Datawetenschap voor Beginners - Een Curriculum
+
+Azure Cloud Advocates bij Microsoft zijn verheugd om een 10-weekse, 20-lessen curriculum aan te bieden over datawetenschap. Elke les bevat pre-les en post-les quizzen, geschreven instructies om de les te voltooien, een oplossing en een opdracht. Onze projectgerichte aanpak stelt je in staat om te leren terwijl je bouwt, een bewezen manier om nieuwe vaardigheden te laten beklijven.
+
+**Hartelijke dank aan onze auteurs:** [Jasmine Greenaway](https://www.twitter.com/paladique), [Dmitry Soshnikov](http://soshnikov.com), [Nitya Narasimhan](https://twitter.com/nitya), [Jalen McGee](https://twitter.com/JalenMcG), [Jen Looper](https://twitter.com/jenlooper), [Maud Levy](https://twitter.com/maudstweets), [Tiffany Souterre](https://twitter.com/TiffanySouterre), [Christopher Harrison](https://www.twitter.com/geektrainer).
+
+**🙏 Speciale dank 🙏 aan onze [Microsoft Student Ambassador](https://studentambassadors.microsoft.com/) auteurs, reviewers en inhoudsbijdragers,** waaronder Aaryan Arora, [Aditya Garg](https://github.com/AdityaGarg00), [Alondra Sanchez](https://www.linkedin.com/in/alondra-sanchez-molina/), [Ankita Singh](https://www.linkedin.com/in/ankitasingh007), [Anupam Mishra](https://www.linkedin.com/in/anupam--mishra/), [Arpita Das](https://www.linkedin.com/in/arpitadas01/), ChhailBihari Dubey, [Dibri Nsofor](https://www.linkedin.com/in/dibrinsofor), [Dishita Bhasin](https://www.linkedin.com/in/dishita-bhasin-7065281bb), [Majd Safi](https://www.linkedin.com/in/majd-s/), [Max Blum](https://www.linkedin.com/in/max-blum-6036a1186/), [Miguel Correa](https://www.linkedin.com/in/miguelmque/), [Mohamma Iftekher (Iftu) Ebne Jalal](https://twitter.com/iftu119), [Nawrin Tabassum](https://www.linkedin.com/in/nawrin-tabassum), [Raymond Wangsa Putra](https://www.linkedin.com/in/raymond-wp/), [Rohit Yadav](https://www.linkedin.com/in/rty2423), Samridhi Sharma, [Sanya Sinha](https://www.linkedin.com/mwlite/in/sanya-sinha-13aab1200),
+[Sheena Narula](https://www.linkedin.com/in/sheena-narua-n/), [Tauqeer Ahmad](https://www.linkedin.com/in/tauqeerahmad5201/), Yogendrasingh Pawar, [Vidushi Gupta](https://www.linkedin.com/in/vidushi-gupta07/), [Jasleen Sondhi](https://www.linkedin.com/in/jasleen-sondhi/)
+
+||
+|:---:|
+| Datawetenschap voor Beginners - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+### 🌐 Meertalige Ondersteuning
+
+#### Ondersteund via GitHub Action (Automatisch & Altijd Actueel)
+
+[Frans](../fr/README.md) | [Spaans](../es/README.md) | [Duits](../de/README.md) | [Russisch](../ru/README.md) | [Arabisch](../ar/README.md) | [Perzisch (Farsi)](../fa/README.md) | [Urdu](../ur/README.md) | [Chinees (Vereenvoudigd)](../zh/README.md) | [Chinees (Traditioneel, Macau)](../mo/README.md) | [Chinees (Traditioneel, Hong Kong)](../hk/README.md) | [Chinees (Traditioneel, Taiwan)](../tw/README.md) | [Japans](../ja/README.md) | [Koreaans](../ko/README.md) | [Hindi](../hi/README.md) | [Bengaals](../bn/README.md) | [Marathi](../mr/README.md) | [Nepalees](../ne/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Portugees (Portugal)](../pt/README.md) | [Portugees (Brazilië)](../br/README.md) | [Italiaans](../it/README.md) | [Pools](../pl/README.md) | [Turks](../tr/README.md) | [Grieks](../el/README.md) | [Thais](../th/README.md) | [Zweeds](../sv/README.md) | [Deens](../da/README.md) | [Noors](../no/README.md) | [Fins](../fi/README.md) | [Nederlands](./README.md) | [Hebreeuws](../he/README.md) | [Vietnamees](../vi/README.md) | [Indonesisch](../id/README.md) | [Maleis](../ms/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Swahili](../sw/README.md) | [Hongaars](../hu/README.md) | [Tsjechisch](../cs/README.md) | [Slowaaks](../sk/README.md) | [Roemeens](../ro/README.md) | [Bulgaars](../bg/README.md) | [Servisch (Cyrillisch)](../sr/README.md) | [Kroatisch](../hr/README.md) | [Sloveens](../sl/README.md) | [Oekraïens](../uk/README.md) | [Birmaans (Myanmar)](../my/README.md)
+
+**Als je wilt dat er extra vertalingen worden ondersteund, staan de talen [hier](https://github.com/Azure/co-op-translator/blob/main/getting_started/supported-languages.md)**
+
+#### Word lid van onze community
+[](https://discord.gg/kzRShWzttr)
+
+# Ben je een student?
+
+Begin met de volgende bronnen:
+
+- [Student Hub-pagina](https://docs.microsoft.com/en-gb/learn/student-hub?WT.mc_id=academic-77958-bethanycheum) Op deze pagina vind je bronnen voor beginners, studentpakketten en zelfs manieren om een gratis certificaatvoucher te krijgen. Dit is een pagina die je wilt bookmarken en af en toe wilt bekijken, omdat we de inhoud minstens maandelijks wisselen.
+- [Microsoft Learn Student Ambassadors](https://studentambassadors.microsoft.com?WT.mc_id=academic-77958-bethanycheum) Word lid van een wereldwijde community van studentambassadeurs, dit kan jouw toegangspoort tot Microsoft zijn.
+
+# Aan de slag
+
+> **Docenten**: we hebben [enkele suggesties opgenomen](for-teachers.md) over hoe je dit curriculum kunt gebruiken. We horen graag je feedback [in ons discussieforum](https://github.com/microsoft/Data-Science-For-Beginners/discussions)!
+
+> **[Studenten](https://aka.ms/student-page)**: om dit curriculum zelfstandig te gebruiken, fork de hele repo en voltooi de oefeningen zelfstandig, te beginnen met een quiz voorafgaand aan de les. Lees vervolgens de les en voltooi de rest van de activiteiten. Probeer de projecten te maken door de lessen te begrijpen in plaats van de oplossingscode te kopiëren; die code is echter beschikbaar in de /solutions-mappen in elke projectgerichte les. Een ander idee is om een studiegroep te vormen met vrienden en samen door de inhoud te gaan. Voor verdere studie raden we [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/qprpajyoy3x0g7?WT.mc_id=academic-77958-bethanycheum) aan.
+
+## Ontmoet het team
+
+[](https://youtu.be/8mzavjQSMM4 "Promovideo")
+
+**Gif door** [Mohit Jaisal](https://www.linkedin.com/in/mohitjaisal)
+
+> 🎥 Klik op de afbeelding hierboven voor een video over het project en de mensen die het hebben gemaakt!
+
+## Pedagogiek
+
+We hebben twee pedagogische principes gekozen bij het ontwikkelen van dit curriculum: ervoor zorgen dat het projectgericht is en dat het frequente quizzen bevat. Aan het einde van deze serie hebben studenten de basisprincipes van datawetenschap geleerd, waaronder ethische concepten, datavoorbereiding, verschillende manieren om met data te werken, datavisualisatie, data-analyse, praktijkvoorbeelden van datawetenschap en meer.
+
+Daarnaast zorgt een laagdrempelige quiz voorafgaand aan een les ervoor dat de student zich richt op het leren van een onderwerp, terwijl een tweede quiz na de les verdere retentie bevordert. Dit curriculum is ontworpen om flexibel en leuk te zijn en kan in zijn geheel of gedeeltelijk worden gevolgd. De projecten beginnen klein en worden steeds complexer tegen het einde van de 10-weekse cyclus.
+> Vind ons [Gedragscode](CODE_OF_CONDUCT.md), [Bijdragen](CONTRIBUTING.md), [Vertaal](TRANSLATIONS.md) richtlijnen. We verwelkomen je constructieve feedback!
+## Elke les bevat:
+
+- Optionele sketchnote
+- Optionele aanvullende video
+- Voorafgaande quiz om op te warmen
+- Geschreven les
+- Voor projectgebaseerde lessen, stapsgewijze handleidingen om het project te bouwen
+- Kennischecks
+- Een uitdaging
+- Aanvullende literatuur
+- Opdracht
+- [Quiz na de les](https://ff-quizzes.netlify.app/en/)
+
+> **Een opmerking over quizzen**: Alle quizzen bevinden zich in de Quiz-App map, met in totaal 40 quizzen van elk drie vragen. Ze zijn gekoppeld vanuit de lessen, maar de quiz-app kan lokaal worden uitgevoerd of worden gedeployed naar Azure; volg de instructies in de `quiz-app` map. Ze worden geleidelijk gelokaliseerd.
+
+## Lessen
+
+| ](./sketchnotes/00-Roadmap.png)|
+|:---:|
+| Data Science Voor Beginners: Roadmap - _Sketchnote door [@nitya](https://twitter.com/nitya)_ |
+
+| Lesnummer | Onderwerp | Lesgroep | Leerdoelen | Gelinkte les | Auteur |
+| :-----------: | :----------------------------------------: | :--------------------------------------------------: | :-----------------------------------------------------------------------------------------------------------------------------------------------------------------------: | :---------------------------------------------------------------------: | :----: |
+| 01 | Data Science definiëren | [Introductie](1-Introduction/README.md) | Leer de basisconcepten achter data science en hoe het gerelateerd is aan kunstmatige intelligentie, machine learning en big data. | [les](1-Introduction/01-defining-data-science/README.md) [video](https://youtu.be/beZ7Mb_oz9I) | [Dmitry](http://soshnikov.com) |
+| 02 | Data Science Ethiek | [Introductie](1-Introduction/README.md) | Concepten, uitdagingen en kaders rondom data-ethiek. | [les](1-Introduction/02-ethics/README.md) | [Nitya](https://twitter.com/nitya) |
+| 03 | Data definiëren | [Introductie](1-Introduction/README.md) | Hoe data wordt geclassificeerd en de meest voorkomende bronnen ervan. | [les](1-Introduction/03-defining-data/README.md) | [Jasmine](https://www.twitter.com/paladique) |
+| 04 | Introductie tot Statistiek & Kansberekening | [Introductie](1-Introduction/README.md) | De wiskundige technieken van kansberekening en statistiek om data te begrijpen. | [les](1-Introduction/04-stats-and-probability/README.md) [video](https://youtu.be/Z5Zy85g4Yjw) | [Dmitry](http://soshnikov.com) |
+| 05 | Werken met relationele data | [Werken met Data](2-Working-With-Data/README.md) | Introductie tot relationele data en de basisprincipes van het verkennen en analyseren van relationele data met Structured Query Language, ook wel SQL genoemd (uitgesproken als “see-quell”). | [les](2-Working-With-Data/05-relational-databases/README.md) | [Christopher](https://www.twitter.com/geektrainer) | | |
+| 06 | Werken met NoSQL data | [Werken met Data](2-Working-With-Data/README.md) | Introductie tot niet-relationele data, de verschillende typen en de basisprincipes van het verkennen en analyseren van documentdatabases. | [les](2-Working-With-Data/06-non-relational/README.md) | [Jasmine](https://twitter.com/paladique)|
+| 07 | Werken met Python | [Werken met Data](2-Working-With-Data/README.md) | Basisprincipes van het gebruik van Python voor data-exploratie met bibliotheken zoals Pandas. Een fundamenteel begrip van Python-programmering wordt aanbevolen. | [les](2-Working-With-Data/07-python/README.md) [video](https://youtu.be/dZjWOGbsN4Y) | [Dmitry](http://soshnikov.com) |
+| 08 | Data voorbereiden | [Werken met Data](2-Working-With-Data/README.md) | Onderwerpen over technieken voor het opschonen en transformeren van data om uitdagingen zoals ontbrekende, onnauwkeurige of incomplete data aan te pakken. | [les](2-Working-With-Data/08-data-preparation/README.md) | [Jasmine](https://www.twitter.com/paladique) |
+| 09 | Hoeveelheden visualiseren | [Data Visualisatie](3-Data-Visualization/README.md) | Leer hoe je Matplotlib kunt gebruiken om vogeldata te visualiseren 🦆 | [les](3-Data-Visualization/09-visualization-quantities/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 10 | Distributies van data visualiseren | [Data Visualisatie](3-Data-Visualization/README.md) | Observaties en trends binnen een interval visualiseren. | [les](3-Data-Visualization/10-visualization-distributions/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 11 | Proporties visualiseren | [Data Visualisatie](3-Data-Visualization/README.md) | Discrete en gegroepeerde percentages visualiseren. | [les](3-Data-Visualization/11-visualization-proportions/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 12 | Relaties visualiseren | [Data Visualisatie](3-Data-Visualization/README.md) | Connecties en correlaties tussen datasets en hun variabelen visualiseren. | [les](3-Data-Visualization/12-visualization-relationships/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 13 | Betekenisvolle visualisaties | [Data Visualisatie](3-Data-Visualization/README.md) | Technieken en richtlijnen om je visualisaties waardevol te maken voor effectieve probleemoplossing en inzichten. | [les](3-Data-Visualization/13-meaningful-visualizations/README.md) | [Jen](https://twitter.com/jenlooper) |
+| 14 | Introductie tot de Data Science levenscyclus | [Levenscyclus](4-Data-Science-Lifecycle/README.md) | Introductie tot de data science levenscyclus en de eerste stap van het verkrijgen en extraheren van data. | [les](4-Data-Science-Lifecycle/14-Introduction/README.md) | [Jasmine](https://twitter.com/paladique) |
+| 15 | Analyseren | [Levenscyclus](4-Data-Science-Lifecycle/README.md) | Deze fase van de data science levenscyclus richt zich op technieken om data te analyseren. | [les](4-Data-Science-Lifecycle/15-analyzing/README.md) | [Jasmine](https://twitter.com/paladique) | | |
+| 16 | Communicatie | [Levenscyclus](4-Data-Science-Lifecycle/README.md) | Deze fase van de data science levenscyclus richt zich op het presenteren van inzichten uit de data op een manier die het voor besluitvormers gemakkelijker maakt om te begrijpen. | [les](4-Data-Science-Lifecycle/16-communication/README.md) | [Jalen](https://twitter.com/JalenMcG) | | |
+| 17 | Data Science in de Cloud | [Cloud Data](5-Data-Science-In-Cloud/README.md) | Deze serie lessen introduceert data science in de cloud en de voordelen ervan. | [les](5-Data-Science-In-Cloud/17-Introduction/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) en [Maud](https://twitter.com/maudstweets) |
+| 18 | Data Science in de Cloud | [Cloud Data](5-Data-Science-In-Cloud/README.md) | Modellen trainen met Low Code tools. |[les](5-Data-Science-In-Cloud/18-Low-Code/README.md) | [Tiffany](https://twitter.com/TiffanySouterre) en [Maud](https://twitter.com/maudstweets) |
+| 19 | Data Science in de Cloud | [Cloud Data](5-Data-Science-In-Cloud/README.md) | Modellen deployen met Azure Machine Learning Studio. | [les](5-Data-Science-In-Cloud/19-Azure/README.md)| [Tiffany](https://twitter.com/TiffanySouterre) en [Maud](https://twitter.com/maudstweets) |
+| 20 | Data Science in de praktijk | [In de praktijk](6-Data-Science-In-Wild/README.md) | Data science gedreven projecten in de echte wereld. | [les](6-Data-Science-In-Wild/20-Real-World-Examples/README.md) | [Nitya](https://twitter.com/nitya) |
+
+## GitHub Codespaces
+
+Volg deze stappen om dit voorbeeld te openen in een Codespace:
+1. Klik op het Code dropdown-menu en selecteer de optie Openen met Codespaces.
+2. Selecteer + Nieuwe codespace onderaan het paneel.
+Voor meer informatie, bekijk de [GitHub documentatie](https://docs.github.com/en/codespaces/developing-in-codespaces/creating-a-codespace-for-a-repository#creating-a-codespace).
+
+## VSCode Remote - Containers
+Volg deze stappen om deze repo te openen in een container met je lokale machine en VSCode met behulp van de VS Code Remote - Containers extensie:
+
+1. Als dit de eerste keer is dat je een ontwikkelcontainer gebruikt, zorg er dan voor dat je systeem aan de vereisten voldoet (bijv. Docker geïnstalleerd) in [de startdocumentatie](https://code.visualstudio.com/docs/devcontainers/containers#_getting-started).
+
+Om deze repository te gebruiken, kun je de repository openen in een geïsoleerd Docker-volume:
+
+**Opmerking**: Achter de schermen zal dit de Remote-Containers: **Clone Repository in Container Volume...** opdracht gebruiken om de broncode te klonen in een Docker-volume in plaats van het lokale bestandssysteem. [Volumes](https://docs.docker.com/storage/volumes/) zijn de voorkeursmethode voor het behouden van containerdata.
+
+Of open een lokaal gekloonde of gedownloade versie van de repository:
+
+- Clone deze repository naar je lokale bestandssysteem.
+- Druk op F1 en selecteer de **Remote-Containers: Open Folder in Container...** opdracht.
+- Selecteer de gekloonde kopie van deze map, wacht tot de container start, en probeer dingen uit.
+
+## Offline toegang
+
+Je kunt deze documentatie offline uitvoeren met behulp van [Docsify](https://docsify.js.org/#/). Fork deze repo, [installeer Docsify](https://docsify.js.org/#/quickstart) op je lokale machine, en typ vervolgens in de rootmap van deze repo `docsify serve`. De website wordt geserveerd op poort 3000 op je localhost: `localhost:3000`.
+
+> Opmerking, notebooks worden niet gerenderd via Docsify, dus wanneer je een notebook moet uitvoeren, doe dat apart in VS Code met een Python-kernel.
+
+## Andere curricula
+
+Ons team produceert andere curricula! Bekijk:
+
+- [Generatieve AI voor Beginners](https://aka.ms/genai-beginners)
+- [Generatieve AI voor Beginners .NET](https://github.com/microsoft/Generative-AI-for-beginners-dotnet)
+- [Generatieve AI met JavaScript](https://github.com/microsoft/generative-ai-with-javascript)
+- [Generatieve AI met Java](https://aka.ms/genaijava)
+- [AI voor Beginners](https://aka.ms/ai-beginners)
+- [Data Science voor Beginners](https://aka.ms/datascience-beginners)
+- [ML voor Beginners](https://aka.ms/ml-beginners)
+- [Cybersecurity voor Beginners](https://github.com/microsoft/Security-101)
+- [Webontwikkeling voor Beginners](https://aka.ms/webdev-beginners)
+- [IoT voor Beginners](https://aka.ms/iot-beginners)
+- [XR Ontwikkeling voor Beginners](https://github.com/microsoft/xr-development-for-beginners)
+- [Mastering GitHub Copilot voor Paired Programming](https://github.com/microsoft/Mastering-GitHub-Copilot-for-Paired-Programming)
+- [Mastering GitHub Copilot voor C#/.NET Ontwikkelaars](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers)
+- [Kies je eigen Copilot avontuur](https://github.com/microsoft/CopilotAdventures)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/SECURITY.md b/translations/nl/SECURITY.md
new file mode 100644
index 00000000..07d60201
--- /dev/null
+++ b/translations/nl/SECURITY.md
@@ -0,0 +1,51 @@
+
+## Beveiliging
+
+Microsoft neemt de beveiliging van onze softwareproducten en -diensten serieus, inclusief alle broncode-repositories die worden beheerd via onze GitHub-organisaties, waaronder [Microsoft](https://github.com/Microsoft), [Azure](https://github.com/Azure), [DotNet](https://github.com/dotnet), [AspNet](https://github.com/aspnet), [Xamarin](https://github.com/xamarin) en [onze GitHub-organisaties](https://opensource.microsoft.com/).
+
+Als u denkt dat u een beveiligingskwetsbaarheid hebt gevonden in een repository die eigendom is van Microsoft en die voldoet aan [Microsoft's definitie van een beveiligingskwetsbaarheid](https://docs.microsoft.com/en-us/previous-versions/tn-archive/cc751383(v=technet.10)), meld dit dan aan ons zoals hieronder beschreven.
+
+## Beveiligingsproblemen melden
+
+**Meld beveiligingskwetsbaarheden niet via openbare GitHub-issues.**
+
+Meld ze in plaats daarvan aan het Microsoft Security Response Center (MSRC) via [https://msrc.microsoft.com/create-report](https://msrc.microsoft.com/create-report).
+
+Als u liever zonder inloggen een melding indient, stuur dan een e-mail naar [secure@microsoft.com](mailto:secure@microsoft.com). Indien mogelijk, versleutel uw bericht met onze PGP-sleutel; u kunt deze downloaden van de [Microsoft Security Response Center PGP Key-pagina](https://www.microsoft.com/en-us/msrc/pgp-key-msrc).
+
+U zou binnen 24 uur een reactie moeten ontvangen. Als dat om de een of andere reden niet gebeurt, volg dan per e-mail op om te controleren of we uw oorspronkelijke bericht hebben ontvangen. Meer informatie is te vinden op [microsoft.com/msrc](https://www.microsoft.com/msrc).
+
+Voeg de onderstaande gevraagde informatie toe (voor zover u deze kunt verstrekken) om ons te helpen de aard en omvang van het mogelijke probleem beter te begrijpen:
+
+ * Type probleem (bijv. buffer overflow, SQL-injectie, cross-site scripting, etc.)
+ * Volledige paden van bronbestand(en) die verband houden met de manifestatie van het probleem
+ * De locatie van de getroffen broncode (tag/branch/commit of directe URL)
+ * Eventuele speciale configuratie die nodig is om het probleem te reproduceren
+ * Stapsgewijze instructies om het probleem te reproduceren
+ * Proof-of-concept of exploitcode (indien mogelijk)
+ * Impact van het probleem, inclusief hoe een aanvaller het probleem zou kunnen misbruiken
+
+Deze informatie helpt ons om uw melding sneller te beoordelen.
+
+Als u rapporteert in het kader van een bug bounty-programma, kunnen meer gedetailleerde rapporten bijdragen aan een hogere beloning. Bezoek onze [Microsoft Bug Bounty Program](https://microsoft.com/msrc/bounty)-pagina voor meer informatie over onze actieve programma's.
+
+## Voorkeurscommunicatietaal
+
+We geven de voorkeur aan communicatie in het Engels.
+
+## Beleid
+
+Microsoft volgt het principe van [Gecoördineerde Kwetsbaarheidsmelding](https://www.microsoft.com/en-us/msrc/cvd).
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/SUPPORT.md b/translations/nl/SUPPORT.md
new file mode 100644
index 00000000..1c8d7560
--- /dev/null
+++ b/translations/nl/SUPPORT.md
@@ -0,0 +1,26 @@
+
+# Ondersteuning
+## Hoe problemen te melden en hulp te krijgen
+
+Dit project gebruikt GitHub Issues om bugs en functieverzoeken bij te houden. Zoek eerst tussen de bestaande
+issues voordat je een nieuw probleem meldt om duplicaten te voorkomen. Voor nieuwe issues, meld je bug of
+functieverzoek als een nieuw Issue.
+
+Voor hulp en vragen over het gebruik van dit project, meld een issue.
+
+## Microsoft Ondersteuningsbeleid
+
+Ondersteuning voor deze repository is beperkt tot de hierboven genoemde bronnen.
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/docs/_sidebar.md b/translations/nl/docs/_sidebar.md
new file mode 100644
index 00000000..0f0a3220
--- /dev/null
+++ b/translations/nl/docs/_sidebar.md
@@ -0,0 +1,40 @@
+
+- Introductie
+ - [Data Science definiëren](../1-Introduction/01-defining-data-science/README.md)
+ - [Ethiek van Data Science](../1-Introduction/02-ethics/README.md)
+ - [Data definiëren](../1-Introduction/03-defining-data/README.md)
+ - [Kansberekening en statistiek](../1-Introduction/04-stats-and-probability/README.md)
+- Werken met data
+ - [Relationele databases](../2-Working-With-Data/05-relational-databases/README.md)
+ - [Niet-relationele databases](../2-Working-With-Data/06-non-relational/README.md)
+ - [Python](../2-Working-With-Data/07-python/README.md)
+ - [Datavoorbereiding](../2-Working-With-Data/08-data-preparation/README.md)
+- Datavisualisatie
+ - [Hoeveelheden visualiseren](../3-Data-Visualization/09-visualization-quantities/README.md)
+ - [Verdelingen visualiseren](../3-Data-Visualization/10-visualization-distributions/README.md)
+ - [Verhoudingen visualiseren](../3-Data-Visualization/11-visualization-proportions/README.md)
+ - [Relaties visualiseren](../3-Data-Visualization/12-visualization-relationships/README.md)
+ - [Betekenisvolle visualisaties](../3-Data-Visualization/13-meaningful-visualizations/README.md)
+- Levenscyclus van Data Science
+ - [Introductie](../4-Data-Science-Lifecycle/14-Introduction/README.md)
+ - [Analyseren](../4-Data-Science-Lifecycle/15-analyzing/README.md)
+ - [Communicatie](../4-Data-Science-Lifecycle/16-communication/README.md)
+- Data Science in de Cloud
+ - [Introductie](../5-Data-Science-In-Cloud/17-Introduction/README.md)
+ - [Low Code](../5-Data-Science-In-Cloud/18-Low-Code/README.md)
+ - [Azure](../5-Data-Science-In-Cloud/19-Azure/README.md)
+- Data Science in de praktijk
+ - [DS in de praktijk](../6-Data-Science-In-Wild/README.md)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/for-teachers.md b/translations/nl/for-teachers.md
new file mode 100644
index 00000000..743cb2c6
--- /dev/null
+++ b/translations/nl/for-teachers.md
@@ -0,0 +1,78 @@
+
+## Voor Docenten
+
+Wilt u dit curriculum in uw klas gebruiken? Voel u vrij!
+
+U kunt het zelfs direct binnen GitHub gebruiken door gebruik te maken van GitHub Classroom.
+
+Om dit te doen, fork deze repository. U zult een aparte repository moeten maken voor elke les, dus u moet elke map uit deze repository afzonderlijk extraheren. Op die manier kan [GitHub Classroom](https://classroom.github.com/classrooms) elke les apart oppakken.
+
+Deze [volledige instructies](https://github.blog/2020-03-18-set-up-your-digital-classroom-with-github-classroom/) geven u een idee hoe u uw klaslokaal kunt opzetten.
+
+## De repository gebruiken zoals deze is
+
+Als u deze repository wilt gebruiken zoals deze nu is, zonder gebruik te maken van GitHub Classroom, is dat ook mogelijk. U moet dan met uw studenten communiceren over welke les gezamenlijk doorgewerkt moet worden.
+
+In een online format (Zoom, Teams of andere) kunt u breakout rooms maken voor de quizzen en studenten begeleiden om zich voor te bereiden op het leren. Nodig vervolgens studenten uit om de quizzen te maken en hun antwoorden op een bepaald moment als 'issues' in te dienen. U kunt hetzelfde doen met opdrachten, als u wilt dat studenten in het openbaar samenwerken.
+
+Als u de voorkeur geeft aan een meer privéformat, vraag uw studenten dan om het curriculum, les voor les, te forken naar hun eigen GitHub-repositories als privé-repositories, en geef u toegang. Vervolgens kunnen ze quizzen en opdrachten privé voltooien en deze via issues op uw klaslokaal-repository aan u indienen.
+
+Er zijn veel manieren om dit te laten werken in een online klaslokaal. Laat ons weten wat voor u het beste werkt!
+
+## Inbegrepen in dit curriculum:
+
+20 lessen, 40 quizzen en 20 opdrachten. Sketchnotes begeleiden de lessen voor visuele leerlingen. Veel lessen zijn beschikbaar in zowel Python als R en kunnen worden voltooid met behulp van Jupyter-notebooks in VS Code. Lees meer over hoe u uw klaslokaal kunt opzetten om deze technische stack te gebruiken: https://code.visualstudio.com/docs/datascience/jupyter-notebooks.
+
+Alle sketchnotes, inclusief een poster op groot formaat, zijn te vinden in [deze map](../../sketchnotes).
+
+Het volledige curriculum is beschikbaar [als een PDF](../../pdf/readme.pdf).
+
+U kunt dit curriculum ook uitvoeren als een zelfstandige, offline-vriendelijke website door gebruik te maken van [Docsify](https://docsify.js.org/#/). [Installeer Docsify](https://docsify.js.org/#/quickstart) op uw lokale machine, en typ vervolgens in de hoofdmap van uw lokale kopie van deze repository `docsify serve`. De website wordt geserveerd op poort 3000 op uw localhost: `localhost:3000`.
+
+Een offline-vriendelijke versie van het curriculum opent als een zelfstandige webpagina: https://localhost:3000
+
+De lessen zijn gegroepeerd in 6 delen:
+
+- 1: Introductie
+ - 1: Wat is Data Science?
+ - 2: Ethiek
+ - 3: Wat is Data?
+ - 4: Overzicht van Kansberekening en Statistiek
+- 2: Werken met Data
+ - 5: Relationele Databases
+ - 6: Niet-Relationele Databases
+ - 7: Python
+ - 8: Data Voorbereiden
+- 3: Data Visualisatie
+ - 9: Visualisatie van Hoeveelheden
+ - 10: Visualisatie van Verdelingen
+ - 11: Visualisatie van Verhoudingen
+ - 12: Visualisatie van Relaties
+ - 13: Betekenisvolle Visualisaties
+- 4: Data Science Levenscyclus
+ - 14: Introductie
+ - 15: Analyseren
+ - 16: Communicatie
+- 5: Data Science in de Cloud
+ - 17: Introductie
+ - 18: Low-Code Opties
+ - 19: Azure
+- 6: Data Science in de Praktijk
+ - 20: Overzicht
+
+## Geef ons uw mening!
+
+We willen dit curriculum laten werken voor u en uw studenten. Geef ons alstublieft feedback op de discussiefora! Voel u vrij om een klaslokaalruimte te creëren op de discussiefora voor uw studenten.
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, willen we u erop wijzen dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/quiz-app/README.md b/translations/nl/quiz-app/README.md
new file mode 100644
index 00000000..87dc2d4d
--- /dev/null
+++ b/translations/nl/quiz-app/README.md
@@ -0,0 +1,139 @@
+
+# Quizzen
+
+Deze quizzen zijn de quizzen vóór en na de lessen in het data science-curriculum op https://aka.ms/datascience-beginners
+
+## Een vertaalde quizset toevoegen
+
+Voeg een vertaling van een quiz toe door bijpassende quizstructuren te maken in de map `assets/translations`. De originele quizzen staan in `assets/translations/en`. De quizzen zijn onderverdeeld in verschillende groepen. Zorg ervoor dat de nummering overeenkomt met de juiste quizsectie. In totaal zijn er 40 quizzen in dit curriculum, waarbij de telling begint bij 0.
+
+Na het bewerken van de vertalingen, bewerk het bestand `index.js` in de vertaalmap om alle bestanden te importeren volgens de conventies in `en`.
+
+Bewerk het bestand `index.js` in `assets/translations` om de nieuw vertaalde bestanden te importeren.
+
+Bewerk vervolgens het dropdownmenu in `App.vue` in deze app om jouw taal toe te voegen. Zorg ervoor dat de lokale afkorting overeenkomt met de mapnaam van jouw taal.
+
+Ten slotte, bewerk alle quizlinks in de vertaalde lessen, indien aanwezig, om deze lokalisatie toe te voegen als queryparameter: `?loc=fr` bijvoorbeeld.
+
+## Projectinstellingen
+
+```
+npm install
+```
+
+### Compileert en herlaadt automatisch voor ontwikkeling
+
+```
+npm run serve
+```
+
+### Compileert en minimaliseert voor productie
+
+```
+npm run build
+```
+
+### Controleert en herstelt bestanden
+
+```
+npm run lint
+```
+
+### Configuratie aanpassen
+
+Zie [Configuratiereferentie](https://cli.vuejs.org/config/).
+
+Credits: Dank aan de originele versie van deze quiz-app: https://github.com/arpan45/simple-quiz-vue
+
+## Deployen naar Azure
+
+Hier is een stapsgewijze handleiding om je op weg te helpen:
+
+1. Fork een GitHub-repository
+Zorg ervoor dat je statische webapp-code in je GitHub-repository staat. Fork deze repository.
+
+2. Maak een Azure Static Web App
+- Maak een [Azure-account](http://azure.microsoft.com) aan.
+- Ga naar het [Azure-portaal](https://portal.azure.com).
+- Klik op "Create a resource" en zoek naar "Static Web App".
+- Klik op "Create".
+
+3. Configureer de Static Web App
+- **Basisinstellingen:**
+ - Abonnement: Selecteer je Azure-abonnement.
+ - Resourcegroep: Maak een nieuwe resourcegroep aan of gebruik een bestaande.
+ - Naam: Geef een naam op voor je statische webapp.
+ - Regio: Kies de regio die het dichtst bij je gebruikers ligt.
+
+- **Details voor implementatie:**
+ - Bron: Selecteer "GitHub".
+ - GitHub-account: Autoriseer Azure om toegang te krijgen tot je GitHub-account.
+ - Organisatie: Selecteer je GitHub-organisatie.
+ - Repository: Kies de repository die je statische webapp bevat.
+ - Branch: Selecteer de branch waarvan je wilt implementeren.
+
+- **Details voor build:**
+ - Build-presets: Kies het framework waarmee je app is gebouwd (bijv. React, Angular, Vue, etc.).
+ - App-locatie: Geef de map op die je app-code bevat (bijv. / als het in de root staat).
+ - API-locatie: Als je een API hebt, geef de locatie op (optioneel).
+ - Outputlocatie: Geef de map op waar de build-output wordt gegenereerd (bijv. build of dist).
+
+4. Controleer en maak aan
+Controleer je instellingen en klik op "Create". Azure zal de benodigde resources instellen en een GitHub Actions-workflow in je repository aanmaken.
+
+5. GitHub Actions-workflow
+Azure maakt automatisch een GitHub Actions-workflowbestand aan in je repository (.github/workflows/azure-static-web-apps-.yml). Deze workflow zal het build- en implementatieproces afhandelen.
+
+6. Monitor de implementatie
+Ga naar het tabblad "Actions" in je GitHub-repository.
+Je zou een workflow moeten zien draaien. Deze workflow zal je statische webapp bouwen en implementeren naar Azure.
+Zodra de workflow voltooid is, is je app live op de opgegeven Azure-URL.
+
+### Voorbeeld van een workflowbestand
+
+Hier is een voorbeeld van hoe het GitHub Actions-workflowbestand eruit zou kunnen zien:
+name: Azure Static Web Apps CI/CD
+```
+on:
+ push:
+ branches:
+ - main
+ pull_request:
+ types: [opened, synchronize, reopened, closed]
+ branches:
+ - main
+
+jobs:
+ build_and_deploy_job:
+ runs-on: ubuntu-latest
+ name: Build and Deploy Job
+ steps:
+ - uses: actions/checkout@v2
+ - name: Build And Deploy
+ id: builddeploy
+ uses: Azure/static-web-apps-deploy@v1
+ with:
+ azure_static_web_apps_api_token: ${{ secrets.AZURE_STATIC_WEB_APPS_API_TOKEN }}
+ repo_token: ${{ secrets.GITHUB_TOKEN }}
+ action: "upload"
+ app_location: "quiz-app" # App source code path
+ api_location: ""API source code path optional
+ output_location: "dist" #Built app content directory - optional
+```
+
+### Aanvullende bronnen
+- [Azure Static Web Apps Documentatie](https://learn.microsoft.com/azure/static-web-apps/getting-started)
+- [GitHub Actions Documentatie](https://docs.github.com/actions/use-cases-and-examples/deploying/deploying-to-azure-static-web-app)
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in zijn oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file
diff --git a/translations/nl/sketchnotes/README.md b/translations/nl/sketchnotes/README.md
new file mode 100644
index 00000000..ff61b47d
--- /dev/null
+++ b/translations/nl/sketchnotes/README.md
@@ -0,0 +1,21 @@
+
+Vind hier alle sketchnotes!
+
+## Credits
+
+Nitya Narasimhan, kunstenaar
+
+
+
+---
+
+**Disclaimer**:
+Dit document is vertaald met behulp van de AI-vertalingsservice [Co-op Translator](https://github.com/Azure/co-op-translator). Hoewel we streven naar nauwkeurigheid, dient u zich ervan bewust te zijn dat geautomatiseerde vertalingen fouten of onnauwkeurigheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet worden beschouwd als de gezaghebbende bron. Voor kritieke informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.
\ No newline at end of file