Redian新闻
>
半天不到,实现仿微博URL短地址算法与解析

半天不到,实现仿微博URL短地址算法与解析

公众号新闻

点击上方“芋道源码”,选择“设为星标

管她前浪,还是后浪?

能浪的浪,才是好浪!

每天 10:33 更新文章,每天掉亿点点头发...

源码精品专栏

 
来源:网络

最近,项目中需要用到短网址(ShortUrl)的算法,于是在网上搜索一番,发现有C#的算法,有 .Net 的算法,有 PHP 的算法,就是没有找到Java版的短网址(ShortUrl)的算法,很是郁闷。同时还发现有不少网友在发帖求助,怎么实现Java版的短网址(ShortUrl)的算法。干脆一不做,二不休,参考了一下网上比较流行的PHP版短网址(ShortUrl)算法:

再根据自己的理解,用Java实现了该短网址(ShortUrl)的算法。目前企业内部能凑合着用,“毫无压力”!

先来废话一下,是在别人的帖子上看到的,主要是让大家了解一下短网址(ShortUrl)。

短链转长链

时下,短网址应用已经在全国各大微博上开始流行了起来。例如QQ微博的url.cn,新郎的t.cn等。

制转换

我们在新浪微博上发布网址的时候,微博会自动判别网址,并将其转换,例如:http://t.cn/hrYnr0。为什么要这样做的,原因我想有这样几点:

1、微博限制字数为140字一条,那么如果我们需要发一些连接上去,但是这个连接非常的长,以至于将近要占用我们内容的一半篇幅,这肯定是不能被允许的,所以短网址应运而生了。

2、短网址可以在我们项目里可以很好的对开放级URL进行管理。有一部分网址可以会涵盖性、暴力、广告等信息,这样我们可以通过用户的举报,完全管理这个连接将不出现在我们的应用中,应为同样的URL通过加密算法之后,得到的地址是一样的。

3、我们可以对一系列的网址进行流量,点击等统计,挖掘出大多数用户的关注点,这样有利于我们对项目的后续工作更好的作出决策。

其实以上三点纯属个人观点,因为在我接下来的部分项目中会应用到,所以就了解了一下,下面先来看看短网址映射算法的理论(网上找到的资料):

① 将长网址用md5算法生成32位签名串,分为4段,,每段8个字符;

② 对这4段循环处理,取每段的8个字符, 将他看成16进制字符串与0x3fffffff(30位1)的位与操作,超过30位的忽略处理;

③ 将每段得到的这30位又分成6段,每5位的数字作为字母表的索引取得特定字符,依次进行获得6位字符串;

④ 这样一个md5字符串可以获得4个6位串,取里面的任意一个就可作为这个长url的短url地址。

很简单的理论,我们并不一定说得到的URL是唯一的,但是我们能够取出4组URL,这样几乎不会出现太大的重复。

首先,请大家了解在Java中如何用MD5来加密字符串得到32位的加密后的字符串,下面是我已经封装好的Java MD5算法:

private final static String[] hexDigits = {
  "0""1""2""3""4""5""6""7"
  "8""9""a""b""c""d""e""f"}; 

public static String byteArrayToHexString(byte[] b){
        StringBuffer resultSb = new StringBuffer();
        for (int i = 0; i < b.length; i++){
                resultSb.append(byteToHexString(b[i]));
        }
        return resultSb.toString();
}

private static String byteToHexString(byte b){
        int n = b;
        if (n < 0)
                n = 256 + n;
        int d1 = n / 16;
        int d2 = n % 16;
        return hexDigits[d1] + hexDigits[d2];
}

public static String MD5Encode(String origin){
        String resultString = null;
                try {

                        resultString=new String(origin);
                        MessageDigest md = MessageDigest.getInstance("MD5");

                        resultString.trim();

                        resultString=byteArrayToHexString(md.digest(resultString.getBytes("UTF-8")));
                }catch (Exception ex){}
                return resultString;
        }

public static void main(String[] args) 
{

        String data = "189022881112011111118:09sz0000123456789987654321";
        System.out.println(MD5Encode(data));
}
public class ShortUrl 
    public static void main(String[] args) 
        String url = "http://www.sunchis.com"
        for (String string : ShortText(url)) { 
            print(string); 
        } 
    } 
     
    public static String[] ShortText(String string){ 
        String key = "XuLiang";                 //自定义生成MD5加密字符串前的混合KEY 
        String[] chars = new String[]{          //要使用生成URL的字符 
            "a","b","c","d","e","f","g","h"
            "i","j","k","l","m","n","o","p"
            "q","r","s","t","u","v","w","x"
            "y","z","0","1","2","3","4","5"
            "6","7","8","9","A","B","C","D"
            "E","F","G","H","I","J","K","L"
            "M","N","O","P","Q","R","S","T"
            "U","V","W","X","Y","Z" 
        }; 
         
        String hex = MD5Encode(key + string); 
        int hexLen = hex.length(); 
        int subHexLen = hexLen / 8
        String[] ShortStr = new String[4]; 
         
        for (int i = 0; i < subHexLen; i++) { 
            String outChars = ""
            int j = i + 1
            String subHex = hex.substring(i * 8, j * 8); 
            long idx = Long.valueOf("3FFFFFFF"16) & Long.valueOf(subHex, 16); 
             
            for (int k = 0; k < 6; k++) { 
                int index = (int) (Long.valueOf("0000003D"16) & idx); 
                outChars += chars[index]; 
                idx = idx >> 5
            } 
            ShortStr[i] = outChars; 
        } 
         
        return ShortStr; 
    } 
     
    private static void print(Object messagr)
        System.out.println(messagr); 
    } 
}

下面来看看程序部分:现在可以直接使用ShortText(url)方法,可以等到下面四组值:

ShortText("http://www.xttblog.com")[0];  //得到值:Jzyqma 
ShortText("http://www.xttblog.com")[1];  //得到值:QBrMzm 
ShortText("http://www.xttblog.com")[2];  //得到值:bQreM3 
ShortText("http://www.xttblog.com")[3];  //得到值:VNBRna 

选取结果中四个值的任何一个值即可作为URL对应生成的短网址了。

目前公司内部的链接还不是特别多,访问也不大。花1天时间,搞个破系统,先上线了完成业务需求。后面再参考网上的一些优秀算法来改进!



欢迎加入我的知识星球,一起探讨架构,交流源码。加入方式,长按下方二维码噢

已在知识星球更新源码解析如下:

最近更新《芋道 SpringBoot 2.X 入门》系列,已经 101 余篇,覆盖了 MyBatis、Redis、MongoDB、ES、分库分表、读写分离、SpringMVC、Webflux、权限、WebSocket、Dubbo、RabbitMQ、RocketMQ、Kafka、性能测试等等内容。

提供近 3W 行代码的 SpringBoot 示例,以及超 4W 行代码的电商微服务项目。

获取方式:点“在看”,关注公众号并回复 666 领取,更多内容陆续奉上。

文章有帮助的话,在看,转发吧。

谢谢支持哟 (*^__^*)

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
视觉RLHF要来了?谷歌复用30年前经典算法,CV引入强化学习法国 vs. 英国小年到,祝福到,愿您岁岁平安!图解各种改地址 | 吐血整理搬家后需要修改地址的清单和攻略抱抱脸:ChatGPT背后的算法——RLHF | 附12篇RLHF必刷论文一日禅 | 得不到就承认得不到,别说是自己不想要奇点已来,推进All on Serverless有哪些困难、如何破局?| 解读Serverless的2022你真的会用【Ctrl+C】【Ctrl+V】吗?金毛消失半天找不到,邻居提醒说莲花池变黄了,主人近看气炸没文化真可怕不到100元,搞定过年下酒菜,嗨吃7天不重样!杭州内推 | 阿里巴巴淘系搜索算法团队招聘机器学习算法工程师最航运 | 科普与解析马士基项目物流England vs. Senegal谷歌复用30年前经典算法,CV引入强化学习,网友:视觉RLHF要来了?特斯拉大降价!华人提车不到两周就“亏”了$13000!德州将要建特斯拉超级工厂,地址曝光……杭州内推 | 阿里巴巴CCO智能服务算法团队招聘NLP算法工程师 (社招P6/P7)秋行南意—南意佛罗伦萨莱切微博&新浪娱乐:2022微博娱乐白皮书(183页)一文详解缺陷检测的传统算法与深度学习算法(内附16篇前沿论文)杭州内推 | 同花顺问财团队招聘NLP算法工程师/图像算法工程师基础算法才是王道!谷歌2022年终总结第五弹:真正的「算法工程师」都在研究啥?【外所】美国凯易,实习,北京,实习期3个月招聘 | 阿里巴巴淘系搜索算法团队-机器学习算法工程师-社招Arlington地区最新学区解析,附上最新房价和租金趋势|地区介绍算法与AI造就更多不公?两本新书的建设性思考带娃来了3趟还没腻,刘亦菲带火的这座小城太宝藏!看海、赏花、吃美食,每天不到100元杭州内推 | 淘系搜索算法技术团队招聘推荐算法工程师Redis实现微博好友功能微服务(关注,取关,共同关注)【友情转发】|【2023 BizTech】嘉宾揭晓:只有你想不到,没有我们请不到!专家:6小时睡眠是最后底线!连续3天不达标的后果你想象不到!来来来,看看芝加哥Downtown的退休房【红圈】中伦,实习/律师,广州,实习可留用看房日记|Capitol Hill短租房2022真实收益达摩院算法团队招聘(实习/博后/全职):机器学习算法工程师,AI for Time Series与AIOps方向
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。