Jak usunąć tagi HTML w Arkuszach Google
Arkusze Google Google Dokumenty Google Bohater / / June 08, 2023
Opublikowany
Jeśli skopiujesz dane ze stron internetowych do Arkuszy Google, mogą one zawierać dużo niechcianego kodu HTML. Oto jak usunąć tagi HTML w Arkuszach Google.
Arkusze Google to świetny sposób na organizowanie i analizowanie danych. Jednak jak w każdym dobrym oprogramowaniu, śmieci na wejściu równają się śmieciom na wyjściu. Jeśli pobierasz dane z innych źródeł, możesz otrzymać więcej, niż się spodziewałeś; możesz nieumyślnie zaimportować potrzebne informacje, ale także kilka bezużytecznych tagów HTML. Dopóki nie pozbędziesz się tych tagów, nie będziesz w stanie wiele zrobić ze swoimi danymi.
Na szczęście usunięcie wszystkich tagów HTML i pozostawienie potrzebnych informacji nie jest zbyt trudne. Oto jak usunąć tagi HTML w Arkuszach Google.
Czym są znaczniki HTML?
Znaczniki HTML są częścią kodu HTML (HyperText Markup Language), który informuje przeglądarkę internetową, jak wyświetlić zawartość tych znaczników. Na przykład znacznik HTML może nakazać przeglądarce wyświetlenie części tekstu pogrubioną czcionką lub kursywą, wyrównanie tekstu do środka lub utworzenie ramki, w której można osadzić treść.
Te znaczniki HTML mają zawsze ten sam format. Rozpoczynają się od nazwy tagu ujętej w nawiasy ostre, np
Podczas kopiowania danych ze strony internetowej, a także wartości, które chcesz skopiować, możesz również przypadkowo skopiować te znaczniki HTML. Nie są one przydatne w Twoim arkuszu kalkulacyjnym, więc będziesz chciał je usunąć i po prostu zostawić informacje, których naprawdę potrzebujesz.
Jak usunąć tagi HTML w Arkuszach Google za pomocą formuły
Możesz utworzyć formułę, która spojrzy na komórkę, usunie wszystkie jej znaczniki HTML i zwróci wszystko, co pozostało. Oryginalna komórka pozostanie nietknięta, ale z nowej komórki zostaną usunięte wszystkie znaczniki HTML, pozostawiając tylko żądane dane. Możesz utworzyć tę formułę dla jednej komórki, a następnie szybko zastosować ją do wielu komórek.
Aby usunąć tagi HTML za pomocą formuły w Arkuszach Google:
- Wybierz komórkę obok pierwszej komórki, która zawiera znaczniki HTML.
- Wprowadź następujące informacje:
=REGEXREPLACE(
- Wybierz komórkę zawierającą kod HTML.
- Wpisz przecinek, a następnie:
"]+>","")
- Naciskać Wchodzić a tagi HTML powinny zostać usunięte z danych.
- Aby zastosować formułę do innych komórek, kliknij i przytrzymaj uchwyt przeciągania w dolnym rogu komórki.
- Przeciągnij w dół komórki, do których chcesz skopiować formułę.
- Zwolnij, a formuła zostanie skopiowana do tych komórek i usunie tagi HTML z pozostałych danych.
Ta formuła działa przy użyciu REGEXZASTĄPIĆ funkcjonować. Ta funkcja umożliwia zastąpienie części ciągu innym ciągiem. Podaj tekst do zastąpienia, wybierając komórkę zawierającą znaczniki HTML.
Następnie podajesz wyrażenie regularne, którego funkcja będzie szukać. W tym przypadku wyrażeniem regularnym jest:
]+>
To wyrażenie szuka łańcucha, który zaczyna się od otwartego nawiasu ostrego, zawiera co najmniej jeden znak, który nie jest nawiasem ostrym, i kończy się zamkniętym nawiasem ostrym. Jak widzieliśmy wcześniej, ponieważ wszystkie znaczniki HTML zaczynają się i kończą nawiasami ostrymi, to wyrażenie regularne znajdzie wszystkie wystąpienia tych znaczników.
Ostatnia część formuły zastępuje wszystkie wystąpienia dopasowań dla wyrażenia regularnego niczym. Ponieważ wszystkie znaczniki HTML są zastępowane niczym, pozostaje tylko pozostały tekst.
Jak usunąć tagi HTML w Arkuszach Google za pomocą funkcji Znajdź i zamień
Wadą tej metody jest to, że chociaż usuwa znaczniki HTML z danych, tworzy nową kolumnę danych i nadal pozostawia oryginalne oznakowane dane. Jeśli usuniesz oryginalne dane, nowe usunięte wartości również znikną, ponieważ formuła nie ma nad czym pracować.
Możesz skopiuj i wklej swoje dane jako wartości, ale to nie jest idealne. Alternatywą jest użycie funkcji Znajdź i zamień w celu usunięcia znaczników HTML z komórek i pozostawienia wyniku w tej samej komórce.
Aby usunąć tagi HTML za pomocą funkcji Znajdź i zamień w Arkuszach Google:
- Kliknij Edytować menu.
- Wybierać Znajdź i zamień.
- w Znajdować wprowadź to samo wyrażenie regularne, którego użyliśmy w naszej formule:
]+>
- Upewnij się, że Wyszukiwanie za pomocą wyrażeń regularnych jest zaznaczone, w przeciwnym razie funkcja Znajdź i zamień wyszuka dokładny tekst naszego wyrażenia regularnego.
- Kliknij Zamień wszystko.
- Tagi HTML powinny zniknąć, pozostawiając tylko te dane, które chcesz.
Dowiedz się więcej o Arkuszach Google
Nauczenie się, jak usuwać tagi HTML w Arkuszach Google, sprawi, że nie będziesz musiał tracić godzin na ręczne edytowanie wszystkich danych w celu usunięcia niechcianych tagów. Korzystając z jednej z powyższych metod, możesz szybko pozbyć się tagów i po prostu zostawić potrzebne dane. Umiejętność korzystania z wyrażeń regularnych jest tutaj prawdziwym ratunkiem; zdecydowanie warto dowiedzieć się więcej o RegEx, ponieważ może to zaoszczędzić ogromną ilość czasu.
Istnieje wiele innych przydatnych porad i sztuczek dotyczących Arkuszy Google, których możesz się nauczyć. Jeśli próbujesz śledzić czas, możesz się tego nauczyć jak używać znaczników czasu w Arkuszach Google. Jeśli formuły nie dają oczekiwanych rezultatów, możesz się uczyć jak wyświetlać formuły w Arkuszach Google więc możesz sprawdzić je pod kątem błędów. A jeśli chcesz skorzystać z danych z innego dokumentu, możesz dowiedzieć się, jak to zrobić wysłać zapytanie do innego arkusza w Arkuszach Google.