Kwalifikacja: INF.03 - Tworzenie i administrowanie stronami i aplikacjami internetowymi oraz bazami danych
Jakie słowo kluczowe w języku SQL należy zastosować, aby usunąć powtarzające się rekordy?
Odpowiedzi
Informacja zwrotna
Słowo DISTINCT w SQL to taki sprytny sposób na pozbycie się duplikatów w wynikach zapytań. Jak robisz zapytanie SELECT, które zwraca różne wiersze, to dzięki DISTINCT dostaniesz tylko unikalne wartości w kolumnach, które wybierzesz. Na przykład, mając tabelę 'pracownicy' z kolumną 'miasto', jak użyjesz zapytania 'SELECT DISTINCT miasto FROM pracownicy;', to dostaniesz listę wszystkich miast, w których są pracownicy, a powtórzenia polecą w odstawkę. Warto pamiętać, że DISTINCT działa na całej kombinacji kolumn, które zwracasz. Jak dodasz więcej kolumn w zapytaniu, to SQL wyciągnie unikalne zestawienia tych kolumn. To naprawdę przydatne, zwłaszcza przy dużych zbiorach danych, gdzie duplikaty mogą namieszać w analizach i raportach. DISTINCT jest standardowym elementem w SQL i działa praktycznie w każdym systemie zarządzania bazami danych, jak MySQL czy PostgreSQL, co czyni to narzędzie mega uniwersalnym w codziennym grzebaniu w danych.
Wybór LIKE, ORDER BY i GROUP BY do eliminacji duplikatów to nie jest dobry pomysł, bo każde z tych słów kluczowych ma swoje inne zastosowania. LIKE służy do szukania wzorców w tekstach. Jak użyjesz LIKE, to znajdziesz rekordy z jakimś ciągiem znaków, ale to nie eliminuje duplikatów. Z kolei ORDER BY to po prostu sortowanie wyników według jakiejś kolumny, a nie eliminacja powtórzeń. Nawet jak posortujesz wyniki, to duplikaty wciąż będą. GROUP BY z kolei grupuje wyniki na podstawie wartości w kolumnach, zazwyczaj używa się go z funkcjami agregującymi, jak COUNT() czy SUM(). Mimo że GROUP BY może pomóc w analizie danych, to nie służy do eliminacji duplikatów, bo tworzy grupy na podstawie kolumn. Każde z tych słów ma swoje zastosowanie, ale żadne z nich nie działa jak DISTINCT, który robi to naprawdę dobrze.