C#에서 사용

@는 역슬레쉬 때문에 붙은거~

        string t = "<h1>kojaedoo</h1>";
        t=  System.Text.RegularExpressions.Regex.Replace(t, @"\<[^\>]+\>", "");
        Response.Write(t);

원문

이 예제에서는 간단한 정규식을 사용하여 HTML 문서에서 태그를 제거하는 방법을 보여 줍니다.

예제

<?XML:NAMESPACE PREFIX = [default] http://ddue.schemas.microsoft.com/authoring/2003/5 NS = "http://ddue.schemas.microsoft.com/authoring/2003/5" />

HTML 태그 대신 \<[^\>]+\>와 같은 정규식을 사용할 수 있습니다. 즉, 다음과 같습니다.

  1. 문자 "<"를 입력합니다.

  2. 문자 ">"를 제외한 하나 이상의 문자 집합을 입력합니다.

  3. 문자 ">"를 입력합니다.

이 예제에서는 공유 System.Text.RegularExpressions.Regex.Replace(System.String,System.String,System.String) 메서드를 사용하여 태그 정규식과 일치하는 모든 문자를 빈 문자열로 바꿉니다.

코드 복사

''' <summary>Removes the tags from an HTML document.</summary>

''' <param name="htmlText">HTML text to parse.</param>

''' <returns>The text of an HTML document without tags.</returns>

''' <remarks></remarks>

Function GetTextFromHtml(ByVal htmlText As String) As String

Dim output As String = Regex.Replace(htmlText, "\<[^\>]+\>", "")

Return output

End Function

이 예제에서는 Imports 문을 사용하여 System.Text.RegularExpressions 네임스페이스를 가져와야 합니다. 자세한 내용은 Imports 문을 참조하십시오.

참고 항목

작업

방법: Visual Basic에서 HTML 문자열의 하이퍼링크 식별
방법: 문자열에서 유효하지 않은 문자 제거

기타 리소스

Visual Basic의 문자열 구문 분석

ms-help://MS.VSCC.v80/MS.MSDN.v80/MS.VisualStudio.v80.ko/dv_vbalr/html/e5f56cfd-2317-48b0-b0a0-40d0094fba45.htm

+ Recent posts